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S. cerevisiae iRNA^'"S^ 
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(zinc finger) 

HKRNGH -28- CKtC 
KHHrGH -30- CEPC 
HKRMGH -25- CCYC 
KRMLAH -32- CPDC 
KKRMGH -29- CQTC 
HLMSNH -29- CKVC 



Integrase (continued) 
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pClal (687) KVAYFRSnNAPHFPQPSDLAEF . . . GIWRSTIAAYSPELtTCLAEWNKLILQQ; 

AA Af/VA *A /V A A*AA*A AAA A 



Reverse Transcriptase 

1731 (880) HHMDVCTAn-NSEL. .KDIVYMKQ?^ ILVYVDOLIL 

ca/JW (999) HC^iDVKTAFLNGTL. . KZEIVMRLPQGISCNS , . DOTCKLNKAIYGLKQAARCWF -34- VLLYVDDWT 

Tnt 1 (919) EQLDVKTAFLHCnL i . EE£IYMEQ?H2FEVrAGKKHMVC3aJ3KSLY^ -3 3 - LLLYVDDMLI 

Tyl (1343)' TCLDISSAYLVADI. .KHHLYIKPPPHU3M -29- ICXFVDDMVL 

Ty4{1381) KTU)INHAFLYAKL. .EEHZYIPEPHD RRCWKU^KALYGLKQSPKEWN -30- lAVYVDDCVl 

pCal(146I) QH3J3VESAYUIA5ITHSKPIYVF??KSVPL. -33- LGLYVDDim 
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— CfT-I: Cladosporium fulvum 

— Tf 1: Schizosaccharomyces pombe 
SyP^' Drosophila melanogaster 
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17.6: Drosophila melanogaste 
Tom: Drosophila ananassae 



' Ty3 : Saccharomyces cerevisiae 
HIVl: Human nnmunodeficiency virus 
RSV: Rous sarcoma virus 



72 



MMLV: Moloney murine leukemia virus 
— Osser Volvox carteri 

Ta 1 : Arabidopsts thaliand 

'-^-^ Tnt 1 : Nicotiana tabacum 



" Tstl: Solanwn tuberosum 
- Hopscotch: Zea mays 
Ty5: Saccharomyces paradoxus 
1131: Drosophila melanogaster 
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— ■ copia: Drosophila melanogaster 
pCal: Candida albicans 

Tyl: Saccharomyces cerevjside 

— — ^ Ty2: Saccharomyces cerevisiae 
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Ty4: Saccharomyces cerevisiae 
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>retrotransposon_l 130 9bp LTR kappa: 698-977 
CTGGATAAAGAftAtCAGAAAAGAGATAGCAGGAAAAGCAGGiUVAAGGTGACG^^ 

.XGGGGATCTGT 

GCCTGTTTCAATTeGAGTATTTGCTGAAGTTGAAAAGAAGtTGAAGCAAAAGAA 
GTAGATATTTA 

TATATGTATATGATTAGACCAACATAAAACTAGACGTCCAAATATTtAf 

attcttattta 

TTAGTGTTATGATCn'TTTGATTCACACAGAGATTTAATCCAAATCAATACCt^ 
T T T TGCT XCT T 

CAAT-TTGTATTTTCAATTCTTTGTATTTATGTTCTTTG 

TTGATAAGGCA " . 

TAAGACCCAAATGTGACTAATCCCCACCATGGCAAGTATGC^ 

GTTGGAATCAC 



cattgttatag . 

TTAGACTTGTTAAAGGGTAGTTGTGTTAATTGAAGATAfGCTGG;AAMCTATACTTTTCGTT 
tXTTTCAATCt 
AGGT 

c gacgttt g t g 

tgagggaaataacaccttgatataagtcgtgcgtattaggtcaacattggtgaaaaa 

gagagccagga 

attagtataaaaagaagagaaaagaaagatatttaggat^^ 

ACACTTTTAGT 



TCTCACGAATA 
TCACATCATTT 



TTANTGGTTAG' 

ATTTCCy^TTCCATATACACACAAGAtGtGAACiS 
GCAAACCACTC 



AGCTACGAAAA 

ACCCAGATGACACTTTCACTTTTGAGATA 
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>retrotransposon 2 .1340bp LTR kappa: 770-1047 
CCCNTTTGTNTGGTACATGtTAGACAGGCCCAAMftATGGTATCATTTAGAACT 

GTTTTGGTCCA 
AC 

ATATGTGGATG 
ATAT 

CGTNAAAATCA 



TAAGAGATACT ...... 

CCTAAA^AAGCAAACCAAGGATNTTAAACTACAeAAN^ 
GATAGATGCGA 



TTAANTCAATT 
AAAAAATTTAT. 
AATTCGTTTAA 



TCCTACAAAGT 

TeAAGACATTtATTGAtGGXATAtTCA?^GGA 
CTACAAATGCT 



GtGTCAGGGAA 
ATAACACCTTa 
GGAATTAGTAT 



AGTGGGCGTAA 

ACTOGATTACTirrGTTTTTTGCTTAriGC^ 
ATTCCGTGTAt 
AC 

ACAACATTCAC 
ACT 

GACTCACAAGA 
TAT 

AAGGGACTAAA 
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>retrotransposon 3 556bp LTR kappa: 1-216 
CAACATTGGGTGAAAAAATTtGGAGTCATCGAGAGGCAGC^ 
ATTTAGGATAT 

CTTATTACAAA. 



TAACTACGCGA 
AACTACTTCGTi 
GAAtGGAAGAG 
TTTACTAAAGTj 
ACTTCCAAAAG 
AAACtGTACGAj 
TAGCCCACCTA 
AATTGGAi 
CCTCGTC 



FIG. 20 



>retrotransposon 4 2112bp Tcal-like LTR: 221-608 
ATTTAATATGTTGGTATTGGCTACTGC(3^CTTCTTAGCTGATGCAGATGCCATTGTTAAT^^ 

AT7 GGGTA^iAT 

AGTATGAAGGAAGCTTTGGCAGGCGTtGTTAtTTTtTTCA^ 
GTCAATTTGAG 

ATtGTGCGAGGGAAAAAAAACGACCTCCATACACtACCTCAA 
TAGAGAGATTT 



■TTTTCTTAGAA 

AATTTGTTCTTTCCTTCAACTGCTTTGAAGAGAGGGAGGTTCAAGTGGTTTAAGTAC^ 
G ATTGCG GCTT 

ATGAGGCCCGAACTGAGTTCyvAATACAAAATCAAGAT^^ 

TATAATACATT 

CTTCAGATATTTAAATTTCTGTGTATCATCCTATAAAACAC^^^ 

AGTGAACTGGT 
ACC 

GACCATG6TGT ... 
AAGAGGTTTGATGGAGTin'CTTTtTTTTAGAAG^^ 
CTCGCAACATT 



TTGAAAAAACG 

AGCTTAATGAGTAGACGGTCTGTTCATATGAAACAAfTGAAAGGGTTG^ 
TAATTCATGTC 



AAATCCCACAA 
GAGAGCGTTAG' 
AAGTATGAGAC 



TTTCAAAACTA 

ATTAATGTAGCTTCTATTTGATAGCCTCTGTTATGGAAATAGATTTG 
T.TCCCAGCTGG 



gcgatcttctt 
aatacctgtgg: 
ggggtagcttg 

GTTAGTCCAGT' 
ATTAGTAATCG 
AetATTTGTTA 
GAACGATAATT 
AACGATGGTTC 
TTAGTGAATAA 
TTAAAGATAAAi 
GCTTAACATTA 
ATCCGCAAATX 
TTCCGATTTCT 
CCGAGCACTAfi- 
AATAGACGTCT 
AATTTATTGTA 
ATTTAAACGGT 
ACTtTGGGGTG( 
TATCGTGTAAC 



AGT CTTCATAC 

ATACCCCGGTClTfCTCTTtTCAATATTCTG 
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>retrotraiisposon 5 3742bp Teal-like LTR: 24 43-2830 

TTAGAAAJWZAGGAAACAGCAATAGAGAGCAATAArrGAAAAATAGTGTTCTCARCAATAGAAC^ 

GTCAAACTTTA 

jy^TGCAAAACATGRAATTCCCAATTTCCAGAATiy^TAATATCAGCATACATGGCC^ 

TACCGTGTCGC 

TTTAACCCCCCCCTTCCTAAAACGAGACAATTAGACATACATTCCACAATTATCATAATCCCCTTTTTT 

TTCCTTACAAA 

ACACTTTATrrrrGTCGTTTTCGTTATTTGCTTCGACGACATTGTAAACTCTTTGGATTTGCAGTAGTA 
GTGCTCCTGGT 

GTAAGGTGGGTTTGGTTGTAGAGTAAAAGAAACGACAATTGATTACACCTCGATATGCATACGCATGGC 
AAAGAGAATAC 

CGAGTTAATAGTGAGTCTATTAGTGTTGCAGGAAAAGTTATACGAACAACATTTTGTTTAGTGTGGATA 
TTCCAGATCAA 

CAACAATATGACTAAAATCATAGCTCTAATTTTCAGTTTACCTTTGTTTATTACGATACTGCCACAGTC 
GTGCTGTACCA 

GGGTCAGTTTTAGAAAAACTATTCTAGAAATGATGAGTAGAAATGTACTATTATGAGCAATATTTCAAA 
AAGTGAAATTA 

TAATTGCTGCTGACAACACCAACAATACATACAAATTTGGAAACGAGCAAATCGAGAAAATTTCAATCC 
GTTTAGCAAGT 

TGTTCGTTGTCGTCATTGTCGATTAGTTTCAGTTTCTAGAGGTGAAATTTTCTATGGCACCAAAACCAA 
AGCCTCAATTT 

TAATTTACTCTGTGTGGTACAAAATACATTAGAGAGGATCCTCTCCAAACAGGATTGCAGGAAGTTTTA 
CACGAGAATGA 

TTTACTACACGACGTTGAATTAAAAAGCTCAACCaGTTTGTCAGCAATTTTGTTCTATCTGTTCAATTT 
CTTGTATAAAA 

TAAAGCAATATGAGAGAGCATCTAAATCAATAATGTCAACACAATATTAAACTTTGAGAAGGATTGTTC. 
AACAAAACAAT 

CCGATGAATAGAAGAAGAATAATATCAAATTGTTCCTGATTGATTGTTGTTATTTATTTTTTATCTCCG 
AATTCCTGCAC 

AATGGCTCAACAACAGCCAACACGGATCACACATTAAATTTTTTTTTCGTGCAGGACCCCGTGGTG^ 
GCTGTGGCTGT 

GATTGTGATCATTGTAGTTTCTGCCTTGATGATGACAAAAAATGATAGAGTTCAGTATGAGGAAGAAAT' 
TAAGCGATATC 

GGTTTATGATGTGTTTAGTTATTAATTGCTCTCAATGGTTTTCAACAACGTATACAAAACTGGTGGTGC 
TTGAAACGAAT 

GAGTAATACAGATCTAATTAAGCTGTGATTTTCTAAGTTTGCCTTGTCTCTACAGTTCAAAAAAAAAGA' 
ACAGAACACCT 

CAGAGGCTGTTGTGATGCAATTrrrAGGAACCTCAACAACMCCACTGACTGATCTAAGCC^ 

TTTAATGGGTT , 
TTCAAAAAGAATGGGGCAAACGGGGAATTGAACCCCGGGCCTCCTCGAATTTTGTGTTTGGTG^^ 

CCAAACGAGGA 

ATCATACCACTAGACCATTCGCCCAATTCGATGACTTGGAATTATTCTAGTTATTm 

ctcagctttat 

TACAGATAGTCATGTTTGCATGGATGAATTAGTACTACTAATAATATAAGAAAACTAGTTAATTGGAGT 
CAATGTC TT AT 

jSatgtcttctgatgggttatgcattgattaattatgaatttcttttaaatacaatctattg^^ 
aottaScawuuiccaacaaa^ 

I^tttScgtacatctataactacaaatagccattcagtttgattatct^ 

TTTGTAATTTC 

tgttaaaatggaaaaccctaatcaaatgtatatgttgaataggtagttaaattgtacaacctactac^ 
^StcagaScaatacttatatctcctggaaactgatacacaa^ 

SSATT^CGTCGTTAAGATTTATACTCATTAGCAAACTaVCTTGCCATATTARACAOT^ 

ItccaaSaScagcacgaaaactaagatactatatatatctgcctatacctgatatac^ 

aSaaa^ccotcaagacaacaccaatatgacaatgccaattatacaat 
attttatggtc 

ATGAGAAATTAACTTATCATGGGGTTAGGCGAGAATATCAACTGTTCGCrrATAGAGAGATTTC^^^ 

^cctgagacggaagtcgatcgacgatgcccatggtgcgtggtgar^ 
actgcSSagaaagggaggttcaagtggtttaagtacgacggtca^ 

CCGAACTGAGT 

TGAAATACAAAATOUWSATATAArrATATACCTTACTTGTCTATATTGTTTTATAATACATTCTT 

T ATT TAAATTT 

CTCTGTATCATTCTATAAAACAGAGATACATTCAGTACATTTAGTATACTGAGTGAACTGGTACCTG^^ 

^GTTTOTCGCACGCTGGCAGACGAACATCAACACT^ 

J^^CTTTmCTTCTTTCTTCAGACGTTGTTGATTTATTTTATCGACyVfiC^^ 

TATCCAAGCGA 

TATACTGGCCAAAGCGAAGTCCTTTTATAAAGCAATGCTACCAAATGTAACAGTTCGAGGTC^ 

TAAGCGGGTAT 

GTTCACACGGATATTTTATGGGGTATCACTTGTACCAAACACTTTCATACGATAAGAATATTTGTAATA 

CTAACTTCAGT 

GTCTTTCATAATCAGCTCATAACCTGTTGGAATTTAAATTCGTATGTTGrTCATTCAAAATTTTGATAA 
^TSrCCTTGCCTCCTAATTAGATTATGACTTAGTACTAACTAAACTGrr^ 

TCCGCTCCATG ' ' 

TTAGAATAGATTATTAGGGCGGTACGTATTTCATAATTTATATATAGGTACTTATTTTTACTAATTTAT 

tgcacaggaaa 

AGATAAAAGGTATCGATTATACCTATCAGCAAGGTTTAAGCAAAATGAAGTATTTTTACCATATTTTTC 
CJVTTTTTATAT 

AGATACATCAAGAGGTTTATTTTAAGTTCACCTGGATAAACCATTCAACTAACCCAATTGAATTGAATG 
ACAATTTGATC 

TCCAAAGAGGGATTCATTTCTATTCTGGAGAGATAAACGTCATTGTTTAGGAAAGAGCAAGAGATAAGA 

TATTCTATjSATATTATTAATGTTATATTACACTATTGTTTGTTTGTTTGrrATAAr^ 
TTCATATGTAA 

GATGTTGTTATCTCTTTCCATTATTTAGCTTTTTTGAARAAGCTATCA^TGGCTCCACGrrr 
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GrSSttCGCTATA&VGAG^^^^ 
TCGTCGATGeC 
CATGGTGCGTGGTG 

T?^ACaCGGTCACAAAGA^ 

CTtACTTSATATTCm 

^gtaStagtatactgagtg^act 
SStctg^ttgtcGtAGacstaggaaca^ 

^TG^AAAA^ATATTAtG^^^ 
GTTTCAACCGt 
AGAGATTACATTt 

CAAGCACGA^^^^ 

GGCA^T^TTtAAGTGGA^^ 
ACACATCCATT 
TGATTCtTTTfl 
AAGGATAGAAA 
GTTGTATGAAG 

AGGGTAAMtGCAATTGAC 

ATA^CCGAATCSTGAGTTATACCGT^ 

GTTTTAGTAGOTACTATT^^ 

aSttggttgtgtttggacttgag 
agcgactca 
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>retrotransposon 7 1304bp Tcal-iike LTR: 74 9-1133 
TGAAGATCTGGCTTTGGCCAAAGTATCAGCtGC^^ 

T^CTGTGGAGCCAAiVVGCTC^ 

aaacgttGaag 

ATTAAAGAAAAAAAAAACAGAAAGAmCG 

AGTCGACTCAA ' ■ 

CAATTCTCTTTTGGTGCACAAAGTTGGTTTTATGGtCARCAATT^^ 

GAATCTAAGAC 
GGAAATGGC 
ATTTGTTCATC 
TTCATCTGATGAT 
ACGAGTCATCC 
TATTG 

TACTACTCCTC 
TATTTTATTACCl 
CAATCAACTTA 



AAAGAAGACTA 

ACAAAAGAAAAAACAAACCGGAGAACCCTtCGCTGTO^ 
CTGAGACGGAA 
TTCGATC 
GTTTTAAGAAA 
ATGAGGTTC 
ATACAAAATGA 
AGAT 

GTATCATCGTA 
TAAAACAiSACAT 
TTCGCGGACGC: 

TGACAGACAAACATTTGGtTiGTAAAA?^^^ 
AAAAAAATCAA 

AtACTTAATeGCAAGCTTTTCAATTTATTGATTGTTTGAATt^ 
ATTGAAATTCA 

TTTGACATGTCAGTGGAAGTTAGA 
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>retrotransposon 8 3604bp POL protein: 591-3575 
AGCCCCAAAATGGTTTTCCTAGNGGAGGATGGAAfGGATGGGACCACCCAC^ 

TTGGTtTAAAA 

AAAAGTTTACGGGGAtGATTTATTTCCAAACCCAGATGTTTCCTiSCTGCTGAAA^^ 
TTTTeAGTNAC 



GAGCA'CGATGA 
TATTATTCTTA 
ATATAAACTTG 



AATTGCCAGAT 

AGTATGACATTGTTGAATQ^tAAGATCA^ 
ACAGTACAAGT 

CAATAATGTTTGATCCAAGAACAATAAAAAGAAGGATGAATGACAACAATTAGCC 
AGTAGGACGTT 



ATATTGAATTT 

GAAAAATXATAGAAAATTAAGTGAACAAAA^ 
AGTATCCGTGG 

TGAATGATAAGACTTTACrrAACGAGATTAAA^ 
CATCTACGGGT 

tATGeTTTAGGTACTCTAACCATATCTGTGj^ 
CCATeXATTCA 

ATTAAACTTAATATCTATAAAACAATTTGAAG^^ 
GTTTCTAGTTC 



CGGGAAACTTT 

CTtMGAAGAATCATj^TGAACAAAACCAA^ 
AACAtATTTGT 



AGAAAGAGTTA 

ACTATGtCAGCATACACAACATCAAAayVGAAGf^ 
ATGATTTATTA 

ATTAATCACCTTTCACAtiSAMAACTACAAfTATTA^ 
AGTTCGGCTGA 



ACAACG6GAAT . . . 

TGGAGCGACCATTACAACGCCrCCATTTGGAtXCC^^ 

ATCTTACAACC 

GTGATTGATCAATTTTCCAGATAtACTGAAGTTATTGTAtctGA^^^^ 
TTGCATAGACT v ... 

TAGGGTCTGGAACAATAGATtTCAGftTMGAfCG^^^ 

ATCGGCTGAGG 

AGtTAGAG<yVGTTAGGAATTTATAAACACCTTCTCCCAAACTACTCTCCTATG^^ 

AAGCAACCAAC 

CGCCCCATTGTCCAAGCTAtTTATAAGGtAGTGTTi^ 
TTTATAGTGGA 

GTATGCGGTTCAtATCCGGAATCATAeACCTATAAAAGAATTl^ 

CTATGGTTTAT . 
CTAAATACGTCAtACCATTTTTTCAGtttGGAACCGACGTTTTG^^^ 

CTATTTCATTA 



GATTCCTTTAC 
CTTCAGAGTTT' 
GATGCAAGTAC 
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TGAATCACCCA 

ATGATTCGCACAAACCAACATGATAGACGTGGAGACAATATAAATGTCGAATATGAAAACCGTCCAAAT 
GTACCATTTGA 

ATATCATGCTGAACCTCCTCGTACAAATTCATCGACGGGAATTATCGATCGACCAGATATTAGACCTAG 
AGCTGATCCCA 

CCTGGCAACGTATGCCTGATGCCAACATACATCAGGAAACAACAACTGTACAGACTCCTGATCATGGGG 
AGTTAGATACC 

ATGATCAACAACGAACACCAACTACCACGATCTGGGGAG6GTAATTACCCCGGGCAACAGGTGCGCACC 
GATATTATTGG 

GCAATTTCGAGATCGCGGGCCTACCACTCTAAACACTCCGATCGATCTAGGTGTACCCGATGAAACAGA 
CGATATTAGTA 

TGACATCAGAGAATCCAATTGATTCCCCAAATTCCGAGATGATCATATCCCCATCTTTACCCACAAATG 
AATTGGAACAT 

CAAATCGATATCAGTTCAGGGGAGATGTCGTTATTGCAAACGAATATGGAAGCAGATAACGAATTGAAA 
ACAAATGAAAT 

GGTATTATACAAATCAAflAAATGATGGTATTATCATTCAACAACAACAATTCACTGAAAATTTGTCAGA. 
TGAAAATGAAG 

AAGATTCATCAACAGATGAGGAAACATTGGAAGACAAAAAACAACAGCGATTGGAATATAATATTTCAC 
CAAACGATGAG 

TGGATAAATAATGACGTTCAGAACGAAGATGACACACAAGTGCCACATGTTAAGGAACCAATCAATTAT 
GAAACTCAAAG 

TAGAAATGGAACAAACATGCCACGAATTGAAATGGGCATAATAGAAAACTTAAGTGATGATGGAAAGAA 
TACACCAC6TG 

AATTACGTATGGTCACCTACGATAATAATAAAAAAATTCAAAAGTACCAAAACAGTAATATCGAGATCC 
TGGAACCCAGA 

AACGAAAATAAAAACCACACATTCATTGAAAGCAACTTAGAATTACTTGACAATCAAGAAATGTTTCAA 
GAAGATCCTCA 

AGTTGAAGATATTCGATTGACAACTCCAAAAAAGGACAAATCGTTATCACCTGATTTCAATCAAACCCA 
TAATGAAATAC 

AACTATTCATGGCAGATATCAATGAAGATATGCTAGAAGAATATGATGAAAATATAAATATGAATGAAG 
TGTTAGCTGAC 

TCCACGGAGACGTTGGACAAAGAATTAGATTTAGATGAAGAAAGTGGAAGGATCGAATATATTGCTGAT 
AGAGTTAGAAA 

NAAGACAGAGGTACTGATGGTGCGCCAmCGGGGAATTNTTTACAGAAAAATGGATAAAGATTTTTGGG 

TCCATTAAAAA 

GGCC 
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>retrotransposon 8 POL protein 995aa 

MKLfaPTKTKGQLILNLKNHTKLSEQKKKTNLLVYDSGATVSVWDKTLLNDIKESNIEIATAEGETST 
A 

YAIXSTLTISVNGLNAKLDGVLyLPSIQLNLISIKQFEDUIYAILISENLMrtVHSDHEPTVIAKYSPKD 
D 

LySGPRSGNFIJCKNflNEQNQIIJ.DTAKKLLGSENIFSEKSSKNPMIDQGKLDPLKMNNKVERVN^ 

IKQEVADKYMIKDLYYYHLLINHLSHEKLQIXVKRGVIKPVKSTSAESAILNCQICVAAHAKLASHNHT 
Q 

QRELERPLQRiHLDTAGPFTSNKTKSYLTTVIDQFSRYTEVIVSDTKAVKQSILHRLRVWNNRFQFKIA 
E 

IRYDKALEYPSAEELEELGIYKHLLPNYSPMLNGTAEATNRPIVQGIYKWLNFSCQVLILFPFIVEYA 
V 

HIRNHTPIKEFDGATPYERYYGLSKYVIPFFQFGTDVLrKCASVQEAISLKLPSSRDKAFPTVMFGAFL 
G 

YGSDSFTFRVLVSTKGYPVITTSNIRPIATMQVLNDYLAYISENSSISYDDTFLSPLNHPMIRTNQHDR 
R 

GDNINVEYENRPNVPFEYHAEPPRTNSSTGIIDRPDIRPRADPTWQRMPDANIHQETTTVQTPDHGELD 
T 

MINNEHQLPRSGEGNYPGQQVRTDIIGQFRDRGPTTLNTPIDLGVPDETDDISMTSENPIDSPNSEMII. 
S 

PSLPTNELEHQIDISSGEMSLLQTNMEADNEIiKTNEMVLYKSKNDGIIIQQQQFTENLSDENEEDSSTD 
E 

ETLEDKKQQRLEYNISPNDEWINNDVQNEDDTQVPHVKEPINYETQSRNGTNMPRIEMGIIENLSDDGK 
N 

TPRELRMVTYDNNKKIQKYQNSNIEISEPRNENKNHTFIESNLELLDNQEMFQEDPQVEDIRLTTPKKD 
K 

SLSPDFNQTHNEIQLFMADINEDMLEEYDENINMNEVLADSTETLDKELDLDEESGRIEYIADRVRXKT 
E 

VSMVRHTGNXLQKNG 
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>retrotransposon 9 1249bp Tca2^1ike LTR: 541-820 

TCTCTATGTAGGCTGACAGGTGAAAATTATGAATTAATTGCATTGGCCAATGACAAATGAATAGACAAA 
ACAGGAAATAA 

GGTTGCAmGTAGCCCAAACAAACTAGATTTCGGTtACGAAT^ 
GTTTAGAGCTC 



GTATAGTTTTG 

agttgacgatttgttttttttttggggttaaattagtgctcg^^^ 
caccat.tttga 

TAAGTTATCTCtGGfCAATCGCAAATACrATGCtTCTAATTAA^^ 

ttgatcaatct 

attggtttgaagtaagagttgattttctgtaaagatttatttggccagtgtagttcggtgtca^^ 

TATTATGATGT ... 

ACACTAAAAAAblCtAARTTTCAAGtCAAtGGGGMC^ 
GTGCACTAT.TT 

TGTGTCAGAAACTGATCAATGAAAATGATGGTTATTAtGAGAAtGGAAAATTTTTCCAT^ 
GTGATGACAGA 

ACTAAACTATATTGTGTAGTATAAATAAGGGTATGAAATACCAACATCCCAGAATATCAACGAGATAGA 
AGAGAGGAGTT 



ATCTCAGGTAA 

AGAAAGtTTATAtTGCATCACTATATAACAACWVTCAGG^^ 
GGtAATATGGA 

AATATAACGCCTCGTAGTTCTACGCACGfGGCAtCC^ 

GAATTAGCTTA 

ATAAGAGCAGtCAAATTAACACGGCTCAATTAATAGTACTTAATAATATGAAGCCGA^ 

TCGTTTGAATA 

ATTTGAAAATAAAATAAAGTAATATAAATAGGTATGCATTTTeCCTACATTTATTTCCT 
TAATTTGTTTC 

CTAAACAGCAACAACAACAATTGAAATTCAAAAATGGTTTCtGlTTCTAAATT^^ 
TTATTAGCTGG 

tcaaagtgtcttccaagAtgttgcItictccacagc^gctt 
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>retrotran3poson 10 5611bp Tca2-like LTR: 1136-1414 

TCTCTATGTAGGCTGACAGGTGAAAATTATGAATTAATTGCATTGGCCAATGACAAATGAATAGACAAA 
ACAGCA71ATAA 

GGTTGCAAAAGTAGCCCAAACAAACTAGATTTCGGTTACGAATTTTCCATCTTTCAAAACAATGAATTT 
GTTTAGAGCTC 

TGTGCCATTTATTGCAACTAAAATGAATATGCAATTAAACAATCAGA6ATGTATTGGATTATCCCCGTG 
GTATACTTTTG 

AGTTCACCATTTGTTTTTTTTTTGGGGTTAAATTAGTGCTCCTACTAAAAATCGCATTTATCTTACACT 
CACCATTTTGA 

TAAGTTATCTCTGGTCAATCGCAAATACTATGCTTCTAATTAAGAGTTCTATGTAAATCCCATTTAATT 
TTGATCAATCT 

ATTGGTTTGAAGTAAGAGTTGATTTTCTGTAAAGATTTATTTGGCCAGTGTAGTTCGGTGTCAAAAATA 
TATTATGATGT 

ACACTAAAAAACACTAAATTTCAAGTCAATGGGGAACACAAAACTGAATTAATTACTATATGTTG6TTT 
GTGCACTATTT 

TGTGTCAGAAACTGATCAATGAAAATGATGGTTATTATGAGAATGGAAA^irrTTTCCATCACACATCAG 
GTGATGACAGA 

ACTAAACTATATTGTGTAGTATAAATAAGGGTATGAAATACCAACATCCCAGAATATCAACGAGATAGA 
AGAGAGGAGTT 

TCAATATATATCTTGTGAATAATAACTTCGTTCTAATTCACTATACACAACTAGACGTGTACACGCTCA 
ATCTCAGGTAA 

AGAAAGTTTATATTCCATCACTATATAACAACAATCAGGCTTTGCAAAAAAACATTTAAAACTAATACT 
GGTAATATGGA 

AATATAACGCCTCGTAGTTCTACGCACGTGGCATCCTTTATCTATTTATTCAATTTACCCCTAATTTAT 
GAATTAGCTTA 

ATAAGAGCAGTCAAATTAACACGGCTCAATTAATAGTACTTAATAATATGAAGCCGATCAATTAACCGA 
TCCTTTGAATA 

ATTrGAAAATAAAATAAAGTAATATAAATAGGTATGCATTTTCCCTACATTTATTTCCTCTTTCTATTT 
TAATTTGTTTC 

CTAAACAGCAACAACAACAATTGAAATTCAAAAATGGTTTCTGTTTCTAAATTATTGAACAATGGATT 
TTATTAGCTGG 

TCAAAGTGTCTTCCAAGATGTTGCTACTCCACAGCAAGCTTCTGTGCAACAATATAACATCGTCAATTC 
TCTTGGCGGTA 

GTGCCCCrTATATTCAAAGAAACGGATATGGGATTTCTACTGATATCCCTGCTGGTTGTGAAATTGCTC 
AAATTCAATTG 

TATTCAAGACATGGTGAAAGATACCCAAGTAAAAGTAATGGTAAAAGTTTAGAAGCAATTTATGCTAAA 
TTTGAAAACTA 

CAAAGGTACTTTTAAAGGTGATTTGGCTTTCTTAAATGATTATACrrATTTTGTTACTGATAAAAACAA 
TTACGAAAAGG 

AAACTAGCCCAAAAAATTCTGAAGGAACCTATGCCGGTACAACCAATGCCTTGCGTCACGGTGCTGCGT 
TTAGAGCCAAA 

TATGGATCCITATACAAGGAAAATTCAACATTACCAGTTTTCTCTTCCAATTCAGGTAGATGTTACCAA 
ACTTCAAGATA 

TTTTGCTAGAGGATrrTTAGGTGATGACTTTAflAGAAGGTAAAACTGTCAAGTTTAACATCATTTCTGA 
AGATGCTGATG 

TTGGTGCCAATACTTTGACTCCAAGAAGTGCATGTTCCAAGAACAAAGAACGGAGCAGTAGTACTGCCA 

AAAAATATAAC 

ACAACATATrrAAATGCTATTGCTGAAAGATTAGTTAAACCAAACCCAGGTTTGAATTTGACTACAAGT 

GATGTCAACAA 

TTTATTCAGTTGGTGTGCTTATGAAATCAACGTCAGAGGAAGTTCACCATTCTGTGATTTATTCACCAA 
T6AAGAATTCA 

TTAAGAACTCTTATGGTAATGATCTTTCCAAATATTATTCTAATGGTGCTGGTAATAATTACACCAGAA 
TCATTGGTTCA 

GTGATTTTGAATTCATCCTTGGAACTTTTAAAAGACACCGAGAACTCTAATCAAGTATGGTTATCATTT 
GCTCATGATAC 

TGATTTAGAAATTTTCCATTCTGCTTTAGGATTATTGGAACCAGCTGAAGATTTACCAACATCTTACAT. 
CCCATTCCCTA 

ACCOVTACGTCCATTCTTCTATTGTTCCACAAGGTGCCAGAATATACACAGAAWVACTTCAATGTGGAA 
ACGATGCTTAT 

GTTAGATACATTATCAACGATGCTCTCGTGCCAATTCCAAAATGTGCTACTGGTCCAGGGTTCTCTTGt 
AAACTTGATGA 

TTTTGAAAATTTCGTTAAAGAAAGAATTGGAGATGTTGACTTTATTAAACAATGTGGTGTCAATAGTAC 
CTACCCATCTG 

AGCTTACTTTCTACTGGGATTATAAAAATGTCACTTACAATGCTCCTTTAGAATTGTAAGACATCATTA 
GATCAATTTAG 

ATATCCAAACATTTATTCGTTATTCTCTTCGTATATTATTTATATTCTTCCTTTTCTTGAAAAAAAAAA 
TAGACAATTTA 

TTTAGACTTTATAACTTTTACrTCGTGTTGCAACAAATTGAGCATTTTACACGAAACTTTAAATAATTG 
AATCCTTCGAA 

AACCAAAGTTTTATTGGTCGACGGGTTGGTTAACATGGAATATATCACTTTCTAATAACTATGTCACAC 
CAACAAATATC 

AATATGAGTGTTTCAGACAAATACCCAGAACTTGTTAGACAA7TTTTCCTTCTTGATGAAGT6AAGGAA 
ATTTTGCCGAA 

CTATCCAAAATACAAAATTTTACTGCAAACTCCTGAAGTCGATCGTGAATACTACAAAAACATCACCAG 
TCCTGAATTCA 

TTAGACAATGGCAGCCAGAAGTCCTCAATCACTACCGAAATAACTGGACCGAAGTCACTCCTCTTTGTG 
CTATTGTACAT 

GATAGAACCATTGATGCCGGTTTGAGAATCCAAAAGTTTTTCCATCCATCCATCTTACCGAATGAACTT 

CATGGCGATGT 

TTGGATACTGGTAAAAGAGAACAAAGAAGAACTCGATGCCTTTATAGAAAATGTGCAATGTCrrTCA^ 

ATAGCTCCAACAGTAAATACACTTATTATCGTTGTGAGTATTGCAAAAAGAATAAAGGTGTTAAAAGTA 
AAAAAACTGAT 

TGCAAGCATAAAATTGCAGTACATGCTCTTGAAGGTGGAAAATACAAAATAGTCTGGCACTTTCAGCAT 
AACCATGCTTT 
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>retrotransposon 11 1308bp Tca2-like LTR: 136-416 
TGGTGCCATTTTTAGAATTGATGTCTGAAATAGAATATGAGGTCCAGAGA^ 

ATCATTTTTTT rTrTrTTrrTTTPTrrA 



CTATTTTGTGT 

CAGAAACTGATCTATGAAAATGATGGTTATTATGAGAATGGAAAATTtTTC^^ 
GAGAGAACTAA 

ATTATATTGTGTAGfATflAtAAAGGGtATGi^TACC^ 
AGGAGTTTCAA 

TATATATCTTGTGAATAATAACTTCGTTCtAATTCACTATTCACAACTAGGCiStGTACACGCTGAATCT 

GAGGTAAAGAA 

AGTTTATATTCCATCACTCTGAAGTCATACATTAATAtTAAATAAACAATCTAACACT^ 

ATAACCTATAG 



CAAGGCAACAT 

CTATTCTTTTATTAATCTCGACGTCTGTTTGAfTJjVGTtGCTCTAA^^ 

TATTTTCTGCA 

MATCAAACACCGATTGCTTTTTGTCTGAA&TTGCTGGTATATCACCACTT^ 

CCACTGTCCTT 

TGTTACTGAGAGATTGGCACTGACATTACCTGAATTGTTCATGTTTGCTGTTGAAAGAGC^^ 
ACtTGGATAAG 

GAGCCGATTCAAAAGAAGATGTGGAGATGAGTGTC^ 
ACAGAAGGAAC 

AAAGTGAACTGGATATTGTAGTTTTGTTGATAGtACfCGCGAG^^^^ 
AATCAGATCTT 

ATGCAATACTCAAATCCAAAGAAACAGtCAATCGAGATGAAAG^ 
AGAATCATGTT 

ACTAGTCATATTTTCTATAAAAATTCAATACTTCATTCTTTTTGTtCAATACTAACTAT^ 

AAATAGATTCA 

AATTTCAACCAGATCCACC^CTTCAtTAGGCT 
CAAGCTTAATT 

GATGGGAAACCCTAGCTTGmTTGAAGGAAAAATACATAATCCAAAtAAC^^ 
TCTCAAAATTC 

GACTTCACCGTCTTCCAACCAAGCAGGT 
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>retrotransposon_12 1672bp Tca2-like LTR: 1346-1533 

CCTATCAGGTACrrCCCCACTTGGATTGiGCTTCTGCCTCTCTTCTTCTCCCAACCATCATCCCAATATC 
ATTCGACCCAT 

CGTCTTCATCGTTGtCCrrCTffT^ 
TCAATTCAGTT 

TGTTTTATGGCATCAGATTTAtAAATTTTTTTAATtTTAtCAACATAATTAT 
TGTAATTTATT 

CAATTTTTCTTGtAAAGAATGACeACCACt^TTTCCTAtT 
AGT.TTCATGAC 



AAATTTTATCA 

ATTAAATTTTTAGAAATTtTAGAATTtAAATAA^^ 

CTAATTAAATT . . 

AGTAATTGATTTAATAAAATTGttGTCCTCGTTGt^^^^^ 
TTCATCAACAA 

TCAAAGTAAGTtGmTGAAGGGGTGGGGGTG.G^^ 
TTTCCTTATAT 



ATATTAGTAAT 



TGAATCGACTC . . „ . 

GTTTCnGATTtGTTTATATATAATATATTGAGAATfTGTAfCAATGATGATTT 

TTAAATATTGT ... , 

AAATCTAATATACTTTGTAAtGTTtTCGGTTTCCCCAAATACGTTTCAA^ 

ATCtCTTGTAA 

TTCATTCAATTGTTGTAAATTGTCAGTAACGATTTCAAATTTATTAT^ 
AGTTAAATTGT 

TAGTTTCAGTGGTATtfGAAtCTTGAGGAATttCT 

GGGTTGTTTTG - 
TTTATTTTGGATAATGTTTTATTTATGTtCTGTTCAATATCTT 

TGTTGTTCAAT 



TGTATGGGCGT 

ATATTTTTTGAGGAGATCAAAGCAAAAAATATTTTGAGACTTATACACGCAACATACAGAACAGTTGTT 
GGTTTGTGCAC 

tattttgtgtcagaaactgatcaatgaaaatgat6gttattatgagaatggaaaatttttccatcacac 
atcaggtgatg 

acagaactaaactatattgtgtagtataaataagggtatgaaatacgaacatcccagaatatcaacgag 

GATAGAANGGG 

ANGGAGTTTCAATTANAATAATCCTGTNGAATAAATAAACTTCCGGNTCCTAAATTCNKCTAATACCNA 
CCAAACCTTAG 

NACCGTNGTAACANCGCCTCCAATCCTCCANGGGAAAAAGAAAANGTTTTAATAATTTCCCNATCCCGG: 
ATT 



FIG. 30 



>retrotransposon_13 690bp Tca2-like LTR: 4 64-690 

TGATACGATTGftATGGTGGAGACAAAATATCCGATGTGTTGAAAGATAAAATTGTACTCGAATATCCCA 
CAATATATGTT 

GCTGCAAATGACGAGTGTTTACAAGATAGAATTATAGATAGCCTTCAATTGGCCGAGGAGGAAGAAGAT 
GACACCACTGA 

CTCAAGTGAGGATGATTCTAGTGACTCAGAGAGTGATGATGATGATAGTGATAGTGGTAGTGAAACCAG 
TAGTATTGGAG 

ACGGTTCAGGTGAAGATAACGATTCTGATTCGGCACCGGAAGAGACATCTCTGAAACTACCACCTTTTT 
CACAGAAATTC 

TTTGAAGCGTCAGCTGAGCCAAAACCAATAATAGAAGAGATAGGATCTAACAAGACTGTAGAAGAACCA 
TAACGAATGAA 

TATAAAATACTTGTATTATGTAGTGCCAATAAAAGTTGAAACGGTCGCACTAGTTTTTAGTCCTGTTGG 
TTTGTGCACTA 

TTTTGTGTCAGAAACTGATCTATGAAAATGATGGTTATTATGAGAATGGAAAACTTTTCCATCACACAt 
CAGGTGATGAC 

AGAACTAAACTATATT6TATAGTATAAATAAGGGTATGAAATACCAACATCCCAGAATATTAATTATAT 
AGAANGGAAGG 

AGTTTAATATATATCCTGTGGAATAACAACTTCGGTCTAATTCACTATAC 
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CGTGGTCAAAA- 
AATGAACTAAGAAG 
TGTTATATTAA 
AATCCAAAGCTC 
TTCAAGAATCA 
TCATTACGAAGTTGTC 
eCTAACCCCAA 
AGATAATTTAAGGAGAATC 
ATTTAAGTACT 
.GATl-CTT 



a 
c 

G 

AGGACAACGTT 



GT^ATdACAS 



tTATGCTAGCATATACCTt 



ATATTTTCGTT ... >^------'i,fAtGTGtTAAATGCTGAG: 



^ItcSg^cgataaaattcAaaat^^^ 

tCAGTAAAGA^^^^ 

tgagctgttac 



CAAGGCAAAAA 

tcaattttgactgaaaatggacgtcattaactctgagtcgctaaaatcaaggtatgaaatatttg^^ 
agaggaaatcg 



GTGTTATGTGC 



GTTACC^GTiAT 

TCTeCGTGTATCACATGTTATTATGCCAAATATGCATATCtAGt^^ 
CACATTTTCTC 

ACCACTGAAGCTATGAAGATAGCCCAXTCGGGAACGGTAAACGAC^^^ 
GAAtATGGGAA 

AATAAACGGGTAGACGTCATTTCCCAGTACCATATTCTATTCAGTCGAACGTCTT^ 
GGCJGACTGGTC 



CAAGTGGAAAC 
ACGGGGAGCTTi 
CCTGGGGAAAA 
CGAGGtGTCTA 
AACCACAAAAG 
TGGCACCACCAi 
TCAATCAAAAA 
AAT' 
AAA 



FIG. 32A 



>retrotransposon_15 6140bp POL protein: 1555-4302; LTR regions: 979- 

1292, 5212-5525 ^i^^r^r-r-nnr^rnnnn-nn 




AGAGCAACCAC 



CCAACTGTTGA 
GGATGATTTATi 
GTGGTGTAAAA 



GGCAATATCAC 
AAGAATATCAt- 
tCTATtCTTGT: 
AAACTGCGCAC* 
TACTCGGTTCC 
TCCGTTCCTTC! 
TTGAGGAAAAC 
TAGGAtTCTGT 
TTTGCTGCTGT 
CAAGTTGTTtG. 
AGGTGCTATTG 
CTGGTGGAGAAi 
ATGAAGCTATC 
AAGAACGGTCA 
CGTTTtGACTA 
GCAAAGATATT. 
TtTTTAGGTTT 



ACATCCTTGAA 
ATGTGTTAATA' 
CAGGCTATATA 



TTTTTATGATT 
TAGATACATCT 
AAAGGATATAA 



GATACAACTTG 



FIG. 32B 



T CNNNNNAAT A 

TTATWVTTAATTAATTACAftAAAAAAACAAAAAAATACA 
GCAAAAAAAAA 

AAAATAATAAfAATATAATAAGAATTAATTAACAATGTCGTT^ 

tggttcacgag 

AAGAGGAAGATCTCACACTGATGATTAAAGCTTTtAGAGATTCA^^ 
CGCAGAAGCTT 
ACTG 

CTTAAAAATGA 
TC 

AGGTGATATTA 
AGGAT 

ATCAAGAAGAA 
TTAC 
A'AGGAAAAAOA 

AGAGTTATAGCAGGTTGAAGAGtTTATTTTGCAAAGAGA^ 
TCAATCTCftAG 



ATACCTTAGCG 

CAGGATCTAGeATTAATTCCAAAATtAGAtCTGGAAATTTGCAAAATT 
TTTGAAACAAA 
ATT 

AAAACCATATA 
AAT 

TACCAGGTCCA 
ATT 
GCAGTTGATTT 

AAGACGTCTCAATAAGGTCACAGTACGAATGTACACTTATCCAACAGACACAA^ 

ACTAACAGATT - 

CCCACTATTTTAGCGCtTTAGAGTrrAAAGAATGCGTtCTATCAGGTA^^ 

aatattttggg 

ATTTCAACATCCGAGGGGAATTATTGCTTTACAACTTTACCGTTtGGAGCAATC^ 

tttagtaactt 



AACCTTAGATG 

AG' 

AGATGCAATTA 
TTAA( 
ATTCAAGCAAT 



CATCTTCATCC 
GAG- 
TTGAAGACAGG 



AATGCAAAACT 
ACC 

AAATGACAAAG 
AAGTCGTTG 
AAAAGGAACTT 
TTGGCAATTATTG 
TATCAAAGTTT 
GGCATCATATTl 
AT-TTTCCCCAA 

AAGTGTACTATfTMGTGGAAAGAAAAAtTTCGTTGCTGATATCATT 
TT AAGGAATT G 

GTAGATGAAGACAAGRtACTAGGACAGACTTTTACAGTCAAdAGAAATTTGAi^^ 

AAT^GAATTG^AAAATCTTAAT 
AG AT GATTTG G 

AAGACAATGATGAAGAGTtACCTCTCCAACTGTTTAAATTAATGA^^^ 
ACAACCAACTT 



AC T AGAGT AAC 

AGACTACTTATGCACACTCGCATAtfGGC:ATCCTGACCATCTATTAAft 
f*TGT C ACT AT T 

GTCAACTAAAOyrGTCAATTCGtGAGGCCATTAGACCATACCGACCACTTGAACCACTCAAGGCATTTA 



FIG. 32C 



ATGGACTACTCTGGACm^ 
ACtGGTTTAAC 
TATT 
CATGTCAGCAC 

CTACAGAATTAGTTACAGATCAAGGTAAAAAAATTTTCATCACAAGCTTTGGCra^ 
TATAAGATACA 



GAAAATATTGA 
AAGCATTAACTJ 
CTACACCTACA 



AAAGATTTAAT 
TG 

TGAACAACAAG 

AAGAGGGCAGAGAACAACAAATTTCAAGAGAAGMCM 
T TT ACGAATTG 

GMGCAATTAAGAAAGCTCGCAAGTTACACACAAATTTGAAA^ 
TTAAAGGAACC 
AT 

TGAATCAAATT 



gagaaaaagga 

ATCTAGAATCAGGATCAGTTGAACrrTAGCATATTCAGCA^ 
TTTAATAAAGA 
ATAT 

GTCAGTCCAAC: 
ATTTfl 
AATCATTGGAG 

GAAAGGGTAGATGACGATCCTGCATATTTCGTCATAATTCAra 
TGAAATGTGTT 
AATATTG 
TATAAACCTTA 
CAATl 
CATTTAGATAC 

ATCTTTGATGTATTAATAGATtATCTtTCTAt^^ 
ATAAGAAGGAA. 
CTTC 

CTATGTTTGGT 
TTTl 
TTACTGGCACA 

caaagwicaMgcAatcatccggcgtaaacttttgg 

ACTTCTACTAA 

GATGGTTCeAGTAAAAATTGtGTTTTATAGTACATCAATAATC 

gcttaaaaagc 

CCCCACT 
TGTTAGCATXT 

tATTGCTTGAGATCGTTTGCTTGTCACTCCACCCTGAAGAAAATT^t 
ATTTCTTGGAC. 
ACACCCCG 
CTTAAATCAAT 

AtTCAAACGAACTCCAW^TtATAAACTATGAAACAAAGAAA(^^ 



FIG. 33 



•>ret-rftt-ransDoson 15 POL protein 916aa 
MSFPRTSsPRPSGS^QEDLTSMKArRDSWE 

KRFLPKQEKEiGStLHRQREEEGDIKDFKTWGEEKE^^^ 

LsMEKEKQEtYQVEDFIlQRDETyiqaGESNQSQQ 

LpSEICKIAVKYPKtretKLRPPPPRDFQYKIQLTDHTQIYSKPYKeNQEE 
P 

APIDAWLHPIFPIRKTNANQSSTklAVbLRRLtn^r^ 
VSIHKDSIKYFGISTSEGNYCmLPFGAINSPTIFTNFVRQIL^^ 
LRRIMEKlilEHQTOMNYNKMQLLTTKINFl/SYSI^^ 
FRIFlPErAKFTOPLNELLKNlWGtmiKiE^ 

WGGYLCQPTFRNDKEVtVPIAFSSHKLTETQSRYRAtffiKEliAIIV 

JyU)KKTTPPPMARFLDL1GSFSPKVYYLSG^ 

MU.PRLEAIELENi;NESQVHKIQTSLE(m3HDLEDNDEELPMSFK^ 

YNDlcatlHDKHHPSTRVTDYLCTIAYWHPbHIiIATOITWCCHY«^^^ 

WGMDYSGPYFNTVQHRYILVAVEYVTGLTIA^rt^TLMDA^ 
T 

SFGYPM 



FIG. 34A 



TATGCAA.CAAA 
TCTGATGGTACTGCCG 

I^?TCTCCGGTCGGATAATGGAGGG(^^^ 

TATTACTCACC 
AAACCTCCAATGCCTATGAAC 
TGGCTCdAGTA 
ATATTGCtTCAATCC 
AATCGTGTfCG 
TCATAAAACAATAAATGGt 
GAAACCGTTtG 
GCTCtCAAGTATATGTG 
TGGTGGGATAT. 
GCCACTAATAAGAAAG 

SSSScCAGCACS 
TGATCTTCACC 
GeGTTACeATTTCCAATl 
TGCTCTCCTCA 
AATTCGTCAGTATGTCCC 

a^^SItcggcaatatgaaacg 
gaacaatacca 

CGATACGAGATAGTGTAAT'I 

S^Saacatctaatgaaaa^ 
caatccaacaa 
cacgtggtcacttgaai 
ggacaccggtc 

GCTACAAGGCTGGa 

St^gScMtcaaactaatctttgca^^^^ 
SScggggaaatagtggaactcatMtt 

TXTGT^^tdAATCGCAGCT^^^^ 

^S^ggtttccgtcgacttggt 
ggagtttatgt 

TGACGACATTCTCArrTGTi 



FiG. 34B 



CTTCTCAATAA 

CTGATAATGGATTATGCCGAAAATTCCTTGGAATTAACGTCTATCAACAAGCAAATGAAATAAGATTAA 
GTTTGAATGAT 

TATATAAGGAGAATGATTGAGGAGTTAAAATTATCTGTCTCAGAAAGAAACCCAGTATCTATAGCATCT 
GATGTCAATTA 

TGAAATATTTAAAGTTAACGAAAATGATGATGAGAAACCATGTGATCAAACCAAATACCGAAGTTTGAT 
AGGCAAGCTCT 

TGTTTGCCAGTAATACTATAAGGTTTGACATCGCCTATTCTGTCAACTCCCTATCCAGGTTTATCAACG 
ATCCCAAAGAA 

AAACATTGGATTGCAGCTGTCAAGGTGGTAAAATATCTCAGTGGTACTCAACGGTATGGTATTTGTTAT 
AACGGTAACGG 

TGACTTGAATATTTACGCTGATAGTGATTGGGCTTCCACTCCATCTGATCGAAAGTCTATTACGGGGTA 
CATTGTTACCT 

ATGCTGGAGCGCCGATAAGTTGGCGTTCCAAGAAGCAGAACGTGATAGCCTTGAGTACGACAGAAGCGG 
AGTTTATGGCT 

CTCACAGAGTCCATAAAGGAAGCCCTTTGGCTAATATACATTTTTCGAGATATTAATGTGATATTGAAA 
TTACCAATTGT 

GATATATGAAGACAACCTACTGTGTCAGAAATTACTTGAAAATCCTCGATTCCATAATAGGACAAAACA 
CATTGACTTGA 

AATATAAATTTACGAAAGACCATATAGAAGCTGGTACAATCAAAGTGGAATCAACTAATTCAGCAGATA, 
ACTTAGCCGAC 

ATGCTAACTAAACCTTTACCAAAAATTAAATTTAAACATTTAAGATGGCTAGCAGGATTAAGACCTTTA 
GATTGATTAGA 

TAATGATAAAATGAAATAAAGATTAATTTGGAGATGCAGGTTGATGGGGAGGATGTTGGAAAAATGAAA 
TATGATCAATC 

CTGCATCTAGAACCTGTGGCAGAATGAAACCTACGAGATTATGAATGACTTGTGAATACAAGTTGAATG 
TTACAGAATGT 

TACCAAGAAGGTTACACTTGAATATATGAATGACTAGAAAGTGAATTGAATGTTACAGAACCTGAATAA 
CAATGTTACAC 

GAATGTGTGAATGATATGAGTTTATCTATAGTAATGTGACATATACACAAAGGTGTGAATGACCGAGAA 
AACAGATGTTA 

CATTACGGGCACTGGAGAGTGCAAGTCTAAAGAATCTTGGAGTAGAAATAAGTAATATAAAAAGGACCA. 
AAGATTCTTTA 

GAGAAAAGTAAATGAAACTATATTAGATTTTATATAACTAACTAACAAATAAATAAAAAATATAATATG 
TCTACAATGCC 

ACCAACTTCCAAACGTACTAGAAAGAGAACTAGAACCGATGATAATGCTGAACCAACTATTCAAGATCC 
TTCACCGCCAC 

TTGCTAATGTTGAACCCACAATTCAAGAGACTCCACCGCTGGTTGAAGrrAGTGATGAGACTAATTCAA 
CTGAAATCAAT 

GAGACAAATAGTAATACTCATGAAGAAACAAATGTATTAACTAATGTGCACTCCTCTCCAATCGAGACA 
GTTACTGAGAG 

GAACTTCAATTTTCAACAATAATAATATTGGTTGGATTTACACGTACGTTGTTGTTACAAAGACGTGAG 
CAGAGTGAGAG 

AGATCAACCTTCATATTCAATCTCATCTCAATCAACGCTCAATTTTTTTTTCTTCTCCCTCTCTTTGTT 
GTTTAACTAAG 

TTTGTTCCCTTCCATCCAAGCAAGTTAGAA 



FIG. 35 



>retrotranspo3on_l6 POL protein 748aa 

^mVILLQSKLPVPFWSIATRCAAFVMNRLPHKTINGKIPYEVWTKQLVNLKMMKPFGSQVYVKIPIGV 
K 

SrSAQALSGIMVGYATNKKGYLVYDPTQNRIFTSSQIICHPSiyPAANLTFNEPLIISSKVTAAHLHPL 
T 

ISNLVIPPTNAVSETPLANCVLSSNSSVCPKVCQLQTVLEHGEDKIYASIIPISIGNMKRTRTNENKIC 
Q 

LDESNNTTIPDSVILSANNVLLNLESRSSIPKSYKEAITSNEKSKWADAMDSSFNSLQSNNTWSLEPLP 
E 

GRKAIGVKWYTIKDTGRYKARLVALGYRQQAGVDFLETYAPVIRGESIKLIFALASKSKLKIHSrDVT. 
T 

AFLNGEISELIFVKQPPGYEDKKRPNHVCKLNRSLYGLKQSPLMWNIKLNDVLIKEGFRRLGGDLGIYI 
S 

KDKRTIMGVYVDDILICGPSDSEIEQVKNNVRKYFSITDNGLCRKFLGINVYQQANEIRLSLNDYIRRM 
I 

EEIJaSVSETNPVSIPSDV^YEIFKVNENDDEKPCDQTKYRSLIGKLLFASNTIRFOIAYSVNSLSRFi: 
N 

bPKEKHWlAATOVVKYLSGTQRYGICYNGNGDLNIY 

Q 

NVIAI^TTEAEFMALTESIKEALWLIYrFRDINVII^PIVIYEDNLSCQKLLENPRFHNR^ 
K 

FTkbHIEAGTIKVEStNSADNUVDML^ 



FIG. 36 



>retrotransposon_17 155pbp LTR zeta: 887-1394 

GTGTTGTGTTGGGTtTGAATTTCTGTATAACTCJV^ 

TTATTAGTCGT 

GTACATTGTTACftATTGTTTCrCGtTCCCCTTtt 
GATAATTTTAT 

ACGTGTTGAGAGGGCTCTCGTCGTGCCCGTGTCCGTTTGCGTTtCCGtGtC^^^ 
CCATGCGGCAC 

CGCACCGTACGGTAATGATATCTGAttGTTGTtG 
CAGGGGTTtCG' 

AAAGATAATGTAGAAACACCA(3GGCTTATAACTGAGAGTTAGAGtA^ 
AATCCTAtAGC 

CeAAACATTATTGGAGAGATCTTACOW^ 
TAAGACGACAT 

TTACGAGCAATAAAi^CATOiCC^ 

TAAAAAGTGTA 

CAACCAGTGTGGAAAAAGAATG(a\AtTGGAATTGAAeAA^ 
TTTCTTGAAAG 

GCAMTCTTTGttTGTTTTTTTTTTTGGGT 
ATGATATTGTT 

GTTGTTATTGTGATATTGTfGTGAAArrTCSACA^ 
GtATAAtTGAA 

CTAAAGACCACCACCAGCACCACCACATAGTTAGCAACGTGATA^ 
CTTGGTACTAT 

ACCACrtGTTGtAATATAGCTAATGCTAATTCT 

cacaggttaac 

taccttaatatagttattgttaatacagttattgctgttgactactattgttattg^ 
ttaggttgagt 

taattgattagtgaaaaccaactaacraccgtattaa^ 
taaaacagaga 

gtgtgttagaaagagaaagggtggattataaatatgtgtaaaatcccct 

ATCTATTGATG 

GTTtCATATATAGAGATTAACGATtATATTTAtMTATAA^ 
CTACAGTATAG 

TATGTCAGAATCAGATCATTTAAACTCTACTAATM^ 
CAGTACAATAA 

TGGCAGATCAAACTGAAGGAGtTAACCC^ 
ATGTTAGAAGG 

ACTTTW^TTGGGCTCGAAATAGTGGTAAATAGGGTCCATAGGATATGACCTGtTACAAGTTTATTTC 
TGATCNAGCCG 

GCCTCtGTGATtAdGGdAATTATTT'rtACC 



FIG. 37 



>retrotransposon_18 21-32bp LTR zeta; 14X8-1926 

TTTTTAAAAGAATTAATTAAATATGATGGATGATAGAAATTAAAGGAAAAAGAAGAAGAACAAAACAAA 
ACBTTTAATTGA 

AAAAAAAGGGAGAAATGAATATTGAATTATTa^GGtTTtAtATTG 
GAAGAATGGGG 

ATAGCAAAACtGTGGGTGAGATTAACTCATCTATGG 
GGGGCACATAA 

ATTATTCh-TTTCATTGATAATCCCGAGTCCGTTTTTTGTTCATTATT 
AACGATAATTA 

TTATTAGTTCrCCCCGATGGfTCGATTtTGGTGG 
CTTTGATAAAT 



GGATGAATCCG 
CTTGGGGAGGCi 
TTGTGAATTTG 
ATCTTGTAAAC' 
CATTTCCTCTA 
TTTGTAGATTAi 
TAAGTAGGGGA 



ttatatttctt 

.GTTTGAACTATTGATTTAtGAGtGTTGTCGTAACAfl^ 
TAATCTTTGAT 



GAAAAGCTCAA 
A' 

AACCACAAATA 



AGAGAGGGTGT 
CA< 

AAAAAATGAAA. 



CTTCAAGACGC 



AACAAAGGAAG 
A' 

GCTAATGCTAA 



GTTAATACAGT 
TATTGCTGTTG 
CAACTAACTAC 
CGtATTAAAtTi 
GGGTGGATTAT 
AAATATGTGTAJ 
TAACGATTATA 
TfTATAAtATA 
ATTTAAACTCT 
ACTAATAATAC 
GGAGGTAACCC 
ACAACAATTACI 
GGGGGAGTAGA 



CCAATTCTCNG. 

GAGATNACTTGATtAACTTNAAATTTTTCCNTGGCCA^^ 
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>retrotransposon 19 .1734bp LTR zeta: 767-1274 

AATAACCAACCAGCTGCTCATTTTTAGAtGTATGTATTTTATAGGAAAATTGAATAACTTGTTATTAC 
ATGGCCTGTTT 



GTATAGTATTG 



TAGTCTTGTAA 
A 

GGTGATGAGGA 



CTTTCTCTTCT 
TTGACATTCAAi 
ACTGGTGCTTG 
TAGAGGTACGT 
AATAAAGGCAT 



AGCTCCATTGG 

AATCTTTCCAAAAGCWVGACGGCTCGGACAGAGTAG 
CGTCTAAGACT" 

GGTGTTGAAACTGCCATCTCCAAATTTGGTCAATTAAATGCTGTCATGttGTAA^^ 
TTGTTGATTAG 

TGTGGAAAGCCtAATAAGGTTATATTGTGCACAGGTTAACTACCTTAATATAGTTATTGTTM^ 
TATTGCTGTTG 

ACTACTATTGTTATTGTTAAATTAAAGTGTtAGGTtGAGTTAATTGATTA^^^ 

cgtattaaatt 

attgtattaagattgattcctattaaggataaaacagagagtgtgttagaaag 

AAATTATGTGTA 

aaatccgctttagagactaatcactagMatct^ 

TTATAATATAA 



CTAATAATACA 

GGAAAeACTTTCATTAGTCTAGATCAAGCCAGtACAATAATGGCAGATCAAACTC^ 
GAACATTTTGT 

AGTeGTAAACTTGAAATTCAAAGAGAAGGGGGGGAATTAAATTGGGTGG^ 
GGTGTGAAAAA 
AATT/! 

AGACTAAAACT 



CACTTGATCAC 



GAATCCTGTTT 

AGAGACTATeCGCTAACAAAAtAGATGAACTTGCTCAAaV^^ 

TTAATATACTA ^w*-.«*^««t. 
AGTATAiaiTTAAGTTATCACGTTAATATTCTATACTATCCATCTCCATCACrTT 



FIG. 39A 



>retrotransposon 20 5734bp LTR zeta: 3344-3851 

GAGATTGTAGTGAAGAATTCftGCTCATTATTACTGTTTTGTGGTTGCTGGAAGGAGGAGGGAT^^ 

ATGCGGCACAA 
CAGTG 

AAGTTTAAATT 
TTCAAGGT 
GGCTAAGTTTT 
TGAAGCAT 

AAGCTCAACTG 

AATACCGtGATTGAAACATTTGAATTfGTATC 

GTTGGTTATGA 
TAATTACfl 
ACAAACCCAAA 
ATTAAATfl 
AAGAAAGAAAA 

AATGTCGTCTTGGCGttfATCTTAATTGTATTCtGTAAACTGGG 
TTTTTTGGATC 
TtGTATG 

TAGAGCTTTAC 

TATTTTTATTTATCAGCAAATAGGGGAATTCAAGTTGCATGTGTTATTCAG?^ 

CAGGCAAGTTG 

CAGCTTATTTCACTCpVGGAGCAATCATCACGGAATtCCGTTTC^ 

TTATGTATAGA —AT AAGA^TAGTCAAGATG 



AACGACTTGAA 

TGtAtTCATATGCAtTACACATTTAGTTTCT 
GTCTGCACTAA 

ctatttgtaacgatgAttatgtgatcaagaattggaattctta™^ 

TTTCGTTAGGG 

TTAtCTTMCTCGAAGTTAAAGTTeCAAAACTXtTC 
TACTCTTCTTG 

GTGGGGAGGAAATCCATTT^tGAfTATAAMTGAAACTCTTGGTAACCT^^^ 

TACATTTTCAA , . ^ -^-^^^^^ ^^^^^ « * ^TCTAATGdAAAttTTAAA 



^ 



FIG. 39B 



TCCATGAAAGG 

GGTGAAAATTTGAAATCAAAATAACTATCTGAACTGAAATACCCCATGGATCTGATATCTTATACAATC 
TAT CAACTAAA 

CAGGGAAGAGTACCTGGAATTC.GAAATGACAATTCCTATTAT^^ 
GTTTGTGACAT 

TCATTGTTTTCCACAACTCTAATGTGAAATTTTTGTTATTGTCATGTAATCCCGGTGTTTC^^ 

TTTCGGTGTtG . . 

CGTTCCATGAtATT.TTGTTATCTCTTGTTTAGATTGAGATAAAGAATTGGTTAGCAGTGTAGCCATTTA 

TGAGTGGTTTG 

TAAAAAGAAGAATTACAAGGTTTGAATGAATTCCAGGCAGGCAGTATTATAAAACCTCGAA^ 
TCAAACCATCA 

GAAAAGAAAGCTTACTAtGATGTACTGCTTAATCTCATATCTATCTTAGJVAACTTAATTCACTGATTGT 
GGCTtGTCCGT 

GAATAATTCGGAAACCTTGTCtTTrrCGGTCCAGTAGGGGGTGCCATAGTCTfGGGtGGTGACAAA^ 
AAAAAAAATTA 

TAGTTGGGGTGGTGGGGTGtACGTCfGAGtAAGTCAGG 
AAACATGGTAC 

GTTCTGCTAAGTAATATCATCGATCTATCTATTTTGCTCTAAATTTTCATAAGCAAATC(^ 
TCGTCAGTTTC 

AATTTCAAGCATACGAAGGGAtAGTGAtt 
TATTAGTCTAC 

GGATTAGACGGTTAGAATGGGATTTNCAAAAGCAOWiGGTeAAGACTTATAGGAAATTCATAGA^^ 
ACACTCTGAAG 

TACTCGATGGTTGGATATATAATAGTTTTGCTAATTTAAACTCTtGCtGTTCGGCtAAGCT^^ 
CAAATGCGGTA 

CTCCGATAGTCTrrATAAATAATACTTGGCAAAAGTTCAATAAATATATGTC^ 
TTACCATTGAC 

GAGGrrrGTAAATTAATTOVTACTTAGGTGACATCGATTAATTTAACAAATAtGTCTGTTtt^ 
CATGATCAGTC 

TTGCAGGAAAAATGTTATTGCCACGACACCTGAAATTAGCCC^ 
AAAAACCCACT' 

TAAAAGAAGTCGGACAAACCtGAACCCGGtATTTTATAAAGt^^ 
ATTACACT'XXC 

CGTCtCAAGACTGGAAGTTGCAAAGC.CATGACAATTGCTOVACCAAATGTG^ 
TCTtGATCGGG 

TAATGTAAACACTTTAACTTTfAGTAAATGAtACCA^ 
ACACTATACAT 

TGGAAMTAAAAAAGTGGCTATGAGAATTAAACAAGATGACCGAGTAATTAAAA 
TAAGCAATACG 

GCTAGGGTTCAATCAATTAAGTGCTGCTtTTTttTGTCGTTGTAtTtCCATTCGTCCA^^ 
ACTGT.TGCAAT 

CTAACATATTTTTTTTAAAAAGAAAACATATTGATAeTTACATGTGGTAACTATTGTCTG^^ 
TTCCGCTCTTe 

AATCTCGGTGTtCCKAtAAtTTCGATGAAAtTAtAAtTAC 

TereGGAGTTGGTTCCAATACAAAGATTGAATTGAATTAGGTGAGAAGAAGAAGAGtCTTAAC 
TGTATTACAGG 

tTTAAACTTTGtTtCTAATTTGACCAOiAAAAGTTGTCTGGACGCCTC^^ 
GATTTCTGTTT 

TCTCATTGGCCTTACTCTATGGAAGTTTTTATACAAGAGCTTCCTTCTAAAATTAAGTCTTTGt 
AATATAGCTAA 

TGCtAATTCTTGATtAGTGTGGAAAGCCTAAtM^ 
GTtATTGTTAA 

TACAGTTATTGCTGTTGACTACTATTGTTATTGTTAAATTAAAGTG7TAGGTTGAGTTAATTGAATAGT 
GAAAACCAACT 

AACTACCGtAttAAATTAtTGtAtTAAGAtt 
GAGAAAGGGtG 

GATTATAAATATGTGTAAAATCCCCTTTAGAGACTAACCACTAGAAATCTATTGAtGGtTTC^^ 
GAGATTAACGA 

TTATATTTATAATATAAGTtGGtAGTTGCtAGTATATTtGAAAGCAC 
AGATCATTTAA 

ACTGTACTAATAATACAGGAAACACTTTCATTAGTCTAGATCAAGCCAGTACAATAATGGCAGATCAAA 
CTCAAGGAGCr 

AACCCACAACACATTCTTCTTGTAAAATTAATTCTATTATAATTCAGGTCTTAGTCGACGCAAM 
ATGTTGCAATT 

GTCCGTAAAeAAtTATACAACAATTTAACCAATGCAACAtCAATTGAAAT 



FIG. 39C 



S^^SSrCTCGTCWUUVCACCAGTCWiTAMGCTrGGAAM 

MGTt^STACGTGAfltfffGGtTTCACT^ 

AACATTTATTG 
OiAATTTTTTATTGTTCGTCfl 

S^SttttgtattaiaacCtcggatascrcaaacaaaaa^ 

SSMCTTGAtAATGCGGGAGTTATTTTTTTTTGAAGCCACm^^^ 
IS™GqVCTAATTCTTAAMTTCCATRCTArrtCTATCA^ 

ttgtcaaatgt 
gaatgcaacaaagtcctg; 

^eSS^AGAAGGCAAGTCGTGCAACAAGmTTATTTC^ 
TAG^ScSAACAAAGTCCTAAtAAGAAAGGTGTTCA^ 

SS?G^caUUlTTGSGTTAGCfAAtTATAGGGGATCAA 

AGBAACAGTCA 
TATAAGAACTCGAATG 

??^MTdTTtAAATGT:TTGGGTGACA<aiTCaGCTCC^ 

?Stct^tmatcacgtgtagrattgatgctgatattc^^ 

?SSSc<aTAACmTeTGaATTT<^GCTTGCTCTTAGATiAAACR^ 
CCASI^TTTGATGTTTtGGGGCAATATTTGGATGGTGTCAACTAGGAG^ 

TCCTCTA^rca^CTTTTCTAAATAATTG^^^ 

^ST^^CGGAAtTC&rATGTATAATTaVAACAAT^ 

A^^tSGAATAAbUiTAACrTGAtATAATACGTACTArt^^ 

SS^raCTCTtmTTTTTTTTTTAAtTGGTAATA^ 

A^AM^LiATTTCTTCATttATmGCI^ACCCTCTACCT^ 

^^SG^TTGGATCTAATTGGNTCAtATTtAGATTT^ 

^GCTGTGStATTTTTGCCSATGTCTCdAAAGCAAA^ 



FIG. 40 



gSSATTTTTTTTTAa.GCCTCGTTAGAC^^^ 

iSaT^GtCACTCTAGTTTTTGGTCT 

SwTGGTAGCATCGtATGGRATTTTCGtATGAAC^^^ 

cg?S?^StcaggacaaAcat.cAt^ 

CTTSSflAcLcTAGTTRTATAGCGAAdv^ 

MTAtS^TAGCTCGGAAGAATAAC^ 

C AACAT CTTT T 
TGACTTGGTAATGTAATTATTC 

TATGGGGTACC 



AC( 

TGATAGrTTCG 
AATTAATK 
GATACCACCTG 
TGTi 

TTGTGCACAGG 
TTAACTACi 

TGAGTTAAT^ 
• Zifr'R.TAAAAC 

MAGAGTGTGTTAGAAAGAGAAAGGGTGGATTAT^^ 
TAGAAATCTAT 
TGATGG 
AAGCACTACAG 
TATAGTAT 
GAAGCCAGTAC 



TTTdTAGCTT^^ 
AACGtTTTGCT 
TC 

GTCCACTAGAG 



TGATTTTTGGT 
CG 

TGA^GAG^TTATATTATGGTTACTCGA 
CAGTGGGACCA 



AATTAAAATTA 

CGATTTMTTCNMAACCtAACCT)^ 
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>retrotransposon 22 1712bp LTR zeta.: 672-1179 
TAACCATGGAATTCCTNGAATTANTllATAATTAACCAAAT^ 
AATTCCATGTT 



GtATGAACAAT 
ATGATAGTT 
TTATAATTACT 
AAT< 
CAGGGATTGTC 



CTATTGACCAA 
GAACTACATi 
TtATATCATeA 



TGAAAGGTTAT 
CGT 
AHATIjAGAGAT 

TMAACTATCAAGAATTGC^^TTAAGGGAAAGTCT^ 

GAAAGCCTAAT 

AMGTTATATTGTGeACAGGTTAACTACCTTAATATAGTTATT^^^ 

rTATTGTTATT 

GTTAAATTAAAGTGTTAGGTTGAGTTAATTGAmGTGAAAA^^ 
TATTAAGATTG 
ATTC 

cccctttagag 
gtagttgctag 

TATATTTGAAAGCACTACAGTATAGTATGTCAGAAtCA^^^ 

acactttcatt 
agtctagatcaagccagxac 

mtgAattS^^ 

AGAATCCAAGA ^ , «>^'^>^'-^"'^'i*'^';TGCtGAG!tTTGAAAACT 



TtGTATTGAAT 
GAAACTCCAGCTCACi 
AAAGAAAAAGT 
TAGAATGCC 
TACTCAATACC. 
CATACGATAAATTTi 
GAGGTTTTGAA 
ATTGAAGAAGTi 
GTTTGGTTACA 

tTTGTCAAAATCtAtATTACCACAAGAGTACC 
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AAAATCTATAA 

TATATAAAAAA 
AATGAGTTCATTi 
AAAAAAGAAAC 
AACCAGATAATTATG 

MTT^CA^AAGACCrCTTTATTAAAATC 

^aI^ct^^cttgattagtgtgga^ 
Sac^^tattgctgttgac^^^ 

ac?SSc^tattaaattattgtattaagat^^^ 

aaagagaaagg 
gtggattataaatAtgtgtj^ 

agSatat^taat^^ 

T^TC^tAATAATACAGGAAACA^ 

gg^aaS^^catagaatacgtt^^ 
aaatttcattg 

TATTAGTGTTTCTTACTG 



CAACAA^TC^*^'^'"'^'"'^^*'"^ 
ACTATGTTTTG 
ATAGGCTTTATNGAAGfl 

cmtagS^^ 

NGGSS^TLGmfTGGGAllN^^ 

TGGAAAGNAAC 

AGCNTNTAAANNAATGGGCT 
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>retrotranspos9n_24 2025bp LTR zeta: 787-1294 

TGGGGAGCAAATGTGAAATTAAAGAGtGTGGTGATATGTAATTTTTTTTCAAAAAAGAT^ 
AAGGATTATAT 

ATTGGTCtAAAAACCATTTtTGCtGGTfCGGCAATAAATC 
TGTTGTTTTGt 

GACATTTCTTATATTTTGTTCTATTTTACAeGACTATTTATTGTTAATWUVTATGtC^ 
TTTCTATTTAG 

TTTTACATATGTTfTTTGACGAC>^TCA^ 
CAATTTATAtT 

GAATTAACATTACCATTTAGTTTTTGATAAGAATAafiTTGCG^ 
ATTGTGAAACA 

ACTATGTAGAATAAAAGTATGAACAAATTCTACGTTCATCATGTGGGGTGt 
GGATGAGAATiS 

CCAAGAAAAATGATGGCGTGACAATTCRATACGGC^^ 
GTGTTTCCCTA 

TCGTCTGAGGAAAAGGTAACAAAACATCGTTTAACCAATTGGTGTTtGTT^^ 
CTGCATAtAGT 

tGCAACGGCAAATTGCAfCCAGCGAGTTAACAGCG^^ 
GACTACTGGGA 

TTGGACTGGGAATAACGACTTAACTAATTAAtGtTCTCGTGGACTCGtTt^^^ 
TATAATATAGC 

TAATGCTAATXdTTGATTAOTGTGGAWiGCCTA^^ 
ATAGTTATTGT 

TAANNCyVGTTATTGTTGtTGAGTACTATTGTtATTGtTAAAftAAAGTG 
AGTGAAAACCA 

ACTAACTACGGTATTAAA7TATTGTATTAA 
AAAGAGAAAGG 

GTGGATTATAAATATGtGTAAAATCCCCTttAGAGACtAACCACtAC^^ 
ATAGAGATTAA 

CGAttATAXrrAfAAtAtAAGtTGGTAGTTGCTAGTA 
ATCAGATTATT 

TAAACTCrAGTAATAATACAGGftAACACTTTCATTAGTCTACa^TCAAGCCiAGTACAATAATG<^ 
AAACTCAAGGA 

GCTAACCCACAACAGGATTGATTATATAATGAtCiTAT 
CTACACAGTTG 

TAACAGTGTTTTACAAAT.CTATGAACGMTAACCGATTC^^ 
TTGAATtGCTA 

ATCGGTACTATAATATTGATGGI^GGTT 
TGCATATACAA 

AACGTGTTATCTGTCTACGAATGGCTTtGTATGTGTATAAAATGTTTCATCAAtTGATAATTAATT 
AATCTGCTTAC 

TGAGGTAAACCCCTTTTAATGCAATAGGAjUCTAtGAGGTATtT^ 
TCCATTTGTAT 

G^^TtGCCGATATAATGAMxaSAAATTAAGGGAAAAAAAA^ 
ACAGGtTCTTG 

TGATTATAATTGGTAACCCeCTCGGCCCTAAAAeTCATA^ 
CTATTATGAAC, 

CCCATTGATTTTGACTACAATTGGATTTGTCGGGTATTGAAACCCAAACATATTAT^^ 
TTTAAATGAAC 

CGTTTACTGiSTAGATCCTATAeTAtAAATACAGCC^ 
AATATCATTTG 

AT.CAATCAATCMGAC^TTACAAA 
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>retrotransposon_25 3583bp 

AAAANNTTCCCCATNGCCTATTCCTAGGNCCCAAAACCAGTTGTCCGAAACTCCATGGATGCCAGAAGT 
GGTGGTCCTCC 

GCCGTtAtGGTTGGiO^GAAAAAGAAACTTGACGAAtTGAAAGT 
GAAGAAGGGGC 

AAAGAAAAAGGAAGAAGAGGCAAAGAAAAAGGCAGAGGAAGCGMGAAGTGTTTTATTTTACT 
TCAAATTTGCA. 

CTACTTTTAATTTGfGTGCAAATATTCTATt-ttACTTGATTTT 
TTTATAGGAGT 

TTTTAtATCTTTTCTTTATCAACTGTTCGCTATAGGGTAGGTCTTCCA^ 
GAtGAAATATT 

TTCTGTTGAGCACTCGTTGtCGAOVGTGAAAAATTt 
TAGAAGGGAGG 

TTCAAGTGTTGGAGAAtAGACAGCGAACACCTGATATTCCCAAGGTCGAATTAGATTGAAAGATARATA 
ATAGTCATATT 

TATTTTGTATTTAGTCAATAAATTATCTTTTTATATTTAAATTCTTAGTATTGTCATACCACGTAGATT 
GATACGGACAT 

ACTTAGCACATTTAACATATAXTAAGCACCGATTACCTGTGACATTCCGGAGTTTACTGTTTCGCGCAC 
GCTGGCAGACG 

AACA7CAACTCATCTTTTATACAATATATTCTTACGATTATAACTTTCAATTAAGAAATACAACTTCTT 
ATTAGCATTCT 

CCTACAAGTTCTTAAGTTCCTAGGAATTTCTTCGAAACTATAATTAAAGACGGAAAAGTGTAAAACAAA 
CAGAAAGCAGA 

GGAGGCCAAGAAGAAAGCAGAGGAGGCCGCCCCACAAAAGTTTGACAACTTTGACGACTTTATTGGCTT 
TGACATCAACG 

acaataccaacgacgaagacatgttgtccaacatggactacgaggacctaaaattggacgacaaagtac 
ctgccaccaca 

gacaacaacttggacyvtgaaau^catacttgaaaacgacgagctgatactagacgggttgaacatgaca 
ttgctcgacaa 

tggcgaccacgtaaacgaagagtttgatgtagacagctttttaaaccagtttggtaattaggggctctg 
ttctacaagac 

atatacagatagtgcaggaataagaaaagaaatattttatatagctatatatttcaagtgtttattctg: 
ttcaacaagtt 

ctaaccgtagatacaccaaatcaccaagtcagacattactgagctagcttaacggtccaactactttaa 
attgcaatccg 

ttctttacttgagtcagtcgactctacaacaactatcctgaggtgattattttttggtggaaattttga 

CCAAATTCTTA 

agcaaaaatctagtttctactgataaataaatacacattgctctacttctgtactccacactctgctat 
tgcttgatagc 

catccttaaatcaacagaatccactaattctgctacttccagaacqvtgactactctacatttttaacc 

ATCTCAATTAA 

TTACCATCTTTTTCTCTCATTATTTGGCACrATGGCCGAGTTGGTCTAAGGCGGTAGACTCAAGAArrA 
TtCTTCTCCTG 

CGATCCAGGGGTTTCTACTATCGTAAGATGCAGGAGTTCGAATCTCCTTGGTGTCATTATTTTTTTTTT 
TCCAAGAACCT 

CTCATTTTTTTTTTTCAAAAATTATTTCTACAATTTCCTCTATTCTTAAAAATCTTTGGTATTAAACTA 
AAAATGTACCT 

AACTAAACTACtAGGCTGGAAAATAATAAATCTAACGTTAACGAAATAAGCAAAAGTAATTTTTTTT^ 
TCAAGACAATT 

CCATGTTTGGGGATGAAAACTGCCTGCAATTATATATCCTGTAACAATCCCCTTATATCAACAACAACC 
CGAGAACAACA 

AAAAGTCCACTGGCAGAAACCTTACCACCAATATTCTCAATTTGTGTCACTGATTGGGCAGTTTGTGTC 
GATATCCATGA 

TGTGGTCAAACTGGCAGCAGTGGTAGATGGATAAACACTTTCAGCAGCAACAGTAACCGAGTTGACAAC 
TTCCTTAGCAG 

CTTGTGTATCACACTCTTCATCATCATCCCAGCTATCATCCTCATCGTCACACTCTGGTTCAGGAGTTt. 
GATCATGTTCA 

TCATCGTAGCCATCTTCACCAGGCCAAACATAATCGTTACCAGATCaVCCCCACCAGCTTCCAGACGAT 
CCACCAGTAAC 

TGAAGAAGAACCGGAATGACCTGAACTAACACCAGAACTGGATCCAGAAGTAGTACCACCACTTGATCC 
AGCACCAGAAC 

CCCACCAAGAGCCTGTGCCAGATCCAGAACTTGATCCACCTGTTGGCACACATtCGCCATCATCtTCTt 
CATACCATTCC 

CATTCACCATCATCAGAGGAGCCACTGGCAGAACCACCGGCATTGTCTTCCCCTTCATAGCCATCATCT 
TCCCAGTCATC 

TGGATAGACAGTGTGTGTGGTAATAACAGTCACAGTCGTGGTATATAGCTGTCCACCTGGAGCAACAGt 
TGTCAGT66AC 

ATGTGGTTGTGATTGTCAACGTAACAGTTTCATCACAGATTTCACCAGATTGTGTGAGATAAGTGGTAA 
ATGTCTGACCA 

CCACCAGTATATGTGATAGAAACAACTTCCGTTTCAGTATGTTGATTAGTGGTTGGAGGTAATTTTGTG 
GTGAGTGTTTG 

AGTTGTTGGCACCCCATCGGAAGTAAATGTTCTAGTGGTTGACACAGTTGGATGGATAGTAGGAATTTC 
AGTTTCACAAT 

CAGTCTCGTCATCGTCGTCATCAGAAGTGGTTGACTTTGTTGGGAGAACAGTAATAGATCCTGACCCAG 
TTGGAATAATA 

GTTGGAAGAACAGACGTTGTTGGAAGAACTGACCCACTTGGAATGATGGTTGGAACGTCTGTCTCACAA 
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tatcttctgtLtggctttttgaaacaactgacga(^ 

AGGACCAAAATTTGGGGCTTCCATTGGATCTTTACAC^ 

TAGTTTCTCTTTCAAGGCTTTACCAGTTGACCTGATCGTA^^ 
TCTTCACTGAT 

CAGCCATCAATCTTTGATAAGCCCTGATTTCTCTCATCTATGCAACAATCTTCTATTGTGAATC^^ 

TTTTGCTAAAC 

TTGTAGTTGGTGTCCAAAAAAAAAAGTGATGTAAAATTTAAATTTTTCTGAACTTGTCGTGTAAAAAAG 

TCTCCAGAAAA 

AGGGACAACACACACACCAATTTTTCACCATACCACACAATTC^^ 
AATAATTACAG 

TACAGCCTCCTATTCNCAATTTTTGGNATTTAAACCAGTTCCCTTGGCAGGTCACCAGTTCAT 
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>retrotransposon 26 770bp POL protein: 2-322, LTR san: 390-377 
TGATTTGAGAAATACCATTGAAGATCTAGAGTTAAAAATAAGGAATTTGCATGTAC^^ 

CAATCTTAAAGAATGATAATTTCCACCCACATA^^ 
AATTGAAAGAT 

OTATTTTTTTCAATATCATATGTTGAATCT 

GATTGAACATACCAAAAGGATT^^^^ 

^GAGATTAAGATAAACAAGAAATTGGTA»^ 

GGGTAGGTCTTCCAAGC^^ 

TTTCACTCAAGAAAATATTTTAT^^ 
CGAACACCTGA 

TATTCCCAAGGTCGAATTAGATTGAAAGATAAATAAT^^ 
TATCTTTTTAT 

ATTTAAATTCTTAGTATTGTCATACCACGTAGATTGATACGGACATACTTAGCACAT^ 
ACCTGTGACATTCCGGAGTTTACTGTTTCGCGCACGCTGGCAGACGAACA 
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>T(»t rotransDOSon 26 POL protein 106aa 
DLRKTIEDLELKIRNLHVHEDNQAVITILKNDNFHPHRPIDICYK^ 

S 

FTKALGRNKLIEHTKRIRERKDYDNNATS I VDVRTL 
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^T-»i-Tot-ransDoson 27 598bp LTR san: 143-523 

CTTC^TGS^C^CTTGTACTflfiTACCCATGATTGTATACTGGTGTGGTTGATCGACT^ 
^T^^GCTTTTATCGCGTATATATTTTTTTTTCCATTGACAATTCTGATTTCACAAATTGTTCGC 

TCTTCCMGCTAATTTTACCCGACACAAGATGAAATATTTTCTGTTGAGCACTCGTTGTCGAC^^ 

AAATTTTCACT 

CAAGAAAATATTTTATCATCACTTTTTCTAGAATGGAGGTTCAAGTGTTGGAGAATAGACAGCGAACAC 

^ggtSttagattgaaagataa^^ 

^5cttaSa?t^ 
gattacctgtg 

acattccggagtttactgtttcgcgcacgctggcagacgaacagattagaagcttggtaaatctttggt 
tattcatcacg 

tcttgagaataatacaaagtttaatatagtattttcaa 
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>retrotranspo3on_28 1082bp LTR san: 558-93a 
ATAACmCAATAATCC^CCTGGTAAACCrrCGTCAGTGGCTCAAACACATTGCTGC^^ 

AACAAGCCCAC 



CTTGTATGGAA 



T AACAGTAC'CG ' 

TATCTCTGTGGCTGGGGCATCtATACTCtTT^ 
ATATATCTGGG 



GGAATCGATGG • .... 

TCAGGAAATGTGAAAATTTTCTtCTCGGGAAATATTTGT(^ 

TT ACGGCCACT 

AAAAGTGTCtACTGAAACtCGGTCTCTAtATCGTCAATO^ 
CGACTTATTGT 



GTTGTCGACAG 
TGAAAAATTTti 
AATAGACAGCG 
AAGACCTGATA 
TCAATAAATTA 
TCTtTTTATAT' 
ACATATATTAA 
GCACCGATTAO 
TGCTACTCCCG 



GTTCAACACTT 

TTTTTTACCplTCCACCAAACCtTATtGTTTTCCCCACCATG. 
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Table ! Transformed colonies per M-g DNA 





S. cerevisiae 


C maliosa 


C. albicans 


pRPU3 


5000 


8600 


6500 


pRC2312 


1600 


6500 


400 
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>retrotransposon 01 994bp Ineyte: 1..994; kappa LTR: 548.. 827 
TAGATATTTATATATGTATATGATfAGACCAACATAAAACTAGAgGT^ 



TTGATAl 
CTTTtCTT 
TTTGAi^ 
GGCAAG 
AAATAG 

AGCTCGGGTOT^CTGTT^^^ 

GACGtTTGTGTCAGGGAAATAACACGTTGATATAAGTCGTGCGTATTAGGTCAACATTGGTGAAAAAT^^ 

GCAGTCATCGAGAGCCAGGAATTAGTATAAAAAGAAGAGAAAAGAAAGATATTTAGGATATTTATTATA 

AGGGACCGAGTTTGAC3GAGACACTTTTAGTGGGCGTAAACTTCATTCACTCTGT.TTTTTGCTTATTACAA 

ATTATCACCTATCGTGTACTAGGAGTAATTCTeACGAATATTCGGTGTATACAAACACTT^^ 

TATGGTGCGGAACTtTATTTGTCtGAACCAAAATGAAAGTCACATCATTTAAATGAACGT 

AGATTCTTTATTCAATAGAAACAATTTCtTCCTTTTTCTTTTCTTTGTAt^^^^ 

CATATACACACAAG , vmr,^ n^A myn d^t 

>retrotransposon_02 1348bp Ineyte: 1... 1348; kappa LTR:. 764. .1043, POL 

f contains stop codons) : <136..714 

TGTATGGTACATGMCGACAGCCCAAAAAATGGTATGATTTAGAACTG 

TrrAarRTTGCGTGATGATGGTATGTTTTTCGTATTATAGTACAATGATGGCTCAATGATTTATTTTA^ 




TCCAAC 
TTTJ 
AGAG 

CAAAAGTGGC 

TTCGTATGGTAAAACGTGG-bTGAGTTCCAAATGATAGATGCGAGftTArcM 

AATGCTGAAGACAATTTCAeTGAGGTTCGAAATGAAAAATTACTTAATTCAAT'TAAAAAATTTATAGCAA 
AAGGTGGTCTGGAAGTGCTGATATGAAeACGAAATTTAATGCAT-TeTGTGGAAAATTCGTTTAAGCTCAC 

AATCGG? 

AAGXTCAAGACATTT 
ACGCTAC? 
TTATGCGAGG 
AAATTTGC:/ 
TTATATAGGG 
TTACAAAl 
TGTGTGl 
TTTTC 

TATATAAAAATGTTAT 
AGTTCCTGii 

CTTTCCCGACAATGCTAA ^. ^, ^ 

>retrotransposort__03 303 4bp. public:. 1. . 85/2131. .3034,- Ihcyt^:: 86.. 2130; kappa 

LtR: 75... 354 
TGGTTGGTC 
ATTTtGTTC 
ACATTG 

TAGGATATTTATTATA^ 
TTTTTTG 

aacaaaa 

TAATTCGATTGAATXcTtTGIGTCGt 

CAGCCAT 
TTAGTATATC 

TTATTGAAAACTTCA* 

TCSAAAAGAAAATTTGATGAAATGCCAAGAACAATATAATTTAGTCAGTAC^^ 
i^CAACAACAACAACAACAACAACAACTGTTCAkTGCAATAATAAGAGAGAAACC^ 

GTTTTTCfl 
AGTTTGTAGTTG 

TPPRTTTTTGGA — 

CATTATAAACTATAT'ATTAfCTTGAAT^ 
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CATTATTTACTAATTTAAGGAAGAATGGGACTTAAAAAAATATCTAAAAACCCATGTGTTCTAGTTTTTC 
ATTTGTTATTAGCTTATTATACTTTACATTATTATTTTTGGTATMT^ 
AG 

GTCTl 
AG 



A( 
GG 



ACTGTAGTAATGCCtAATCTAATTACTAAATAGAAATATAGAATGGGGTATGGTTGA^^^ 



ATTCGGTAGAAtCCGAAAGACTAATGAAGAAAAAATCAAGAAAAAAGGTTAAGGTC^ 
GGCAAATATGTAAGTAAGTTCGAT 

>retrotransposon_04 3504bp public: 1. . 4 66/2581 . .3504 , Incyte: 467. ,2580; 
Teal --like LTR: 688.. 1075 



GAGATTTCCTAGCCC5i3AATGCACGACAATCGTGAGACGGAAGTCGATCGTCGATG^ 



TGGTT 

GeCTCTGTTATGGAAATAGATTTGCTCTG^ 



TAG 

TGGCGWTAdTAATCGACTATTTGtTAATGCAGAAAAAATT 




FIG. 71C 



AAnrGTTATTTTGATGGAACGATAATTAAGGATGGTTCTGCACAAAAATGTGGTCCAAAGCCCCAGACTA 
TTC 

T.GCTC1 
AGAAAAC 
ATP 

AAACGC 
TCACTATAT 
ACTTGC 



CAGTtATC 
TTACi 
AGA< 



QQ^fj(-'na»a»'p/^r«r'anaTfznrr*KTAAAJVc:c^A^L;rAt:iL^ l x x x xj, j.wu-i™-wwwaxjGAGATG 



GGAGT. 



AATG 

>retrotransp6sbh 05 3955bp Incyte: 1..3955; tcal-iike LTR: 2656.. 3043 
TGTTAATTGATAGTAAGTGTAATT.GATTGGAATAGTAGAAAAAAAAGAAAG 



TCTi 

GG- 

TG 



AA' 
GA( 
A 

TATTAG' 



CCA< 



AAAT 

TTTTCTAT' 
ATCC 
CTCAA^ 
GCATC 
AtA( 
GAGAAT 
TG< 

TGAGG. 

tttggcttgVctctacagttcaaaaraaaagaacag 

GAACCTCAACAACAACCACTGftCTGATCtAAGCCAGCATCTGTTTAATGGGTTTTCAMAAGAATGGGG^^ 
AAACGGGGAATTGAACCCCGGGGCTCGTGGAATTTTGTGTTTGGTGAAGAACCGAAACGAGGAATCATAC 
CACTAGACCATTCGCCGAATTCGATGACTTGGAATTATTCTAGTtATTTTTGACATACAAAG.CTCAGCTT 
TATTACAGATAGTCATGTTTGCATGGATGAATTAGTACTACTAATAATATAAGAAAACTAGTTAATTGGA 
GT.CAATGTCTTATACATGTCTTCTGATGGGTTATGCATTGATTAATTATGAATTTCTTTTAAATACAATC 
TATTGCTATTATTTGTATGTAAAACTTTAeCCAAAAACCAACAAAAAAGAGTGGlTGTTGGATAAAGATTA 
AAGtARTTCCAAAAAGATTTGGTAATTAGCTATATTGTTTTGACGTACATCTATAACTACAAATAGCCAT 
TCAGTTTGATTATGTATATTGACATAGTTGGATTTGTAATTTCTGTTAAAATGGAAAACCCTAATCAAAT 
c5TATATGTTGAATAGGTAGTTAAATTGTACAACGTACTACTTGtTGTCAATTGAATTCAGAGGCAATACT 
TAtATCTCCTGGAAACTGATACAGAAACGAATTGTTAAACTATAACACTCGAeGTTCACATCTAAGGATT 



FIG. 71D 



CATCGTCGTTAAGATTTATACTCATTAGCAAACTCACTTGCCATATTAAACACTT^ 
ACAATC 



GCTATAGAGAGATTTCCTAGCCGGAATGCACGACAAfCCTGAGAGGGAAGTCGATCGACGATGCGCATGG 
TGCGTGGTGAAAAATTTTCTTAGAAAATTTGTTCTTTGCTTCAACtGCTTTGAAGAAAGGGAGGTTCAAG 
TGGTTTAAGTACGACGGTCACAAAGATtGCGGCTTATGAGGCeGGAACTGAGTTGAAATACA^^ 



TTTCTC 

TTC 

TAACAGTTCGAGGTCAGAAGATTAAGCGGGTATGTTCACACGGATATTTm^ 



gcttttt-tgAaaaagctat.caatggctcgacgttt 

>retrotransposori_06 1434bp public: 1 . . 1434 ; Tcal-iike LTR: 87 ..475 



ACT' 
GAT. 
AAC 
AATTCAi 



AATGACSTTCGACAAATGTTTTACTAGATACTATTAATTTCGATGTACTATATAAGTTTAACCAGCTATAA 



ATCGTGAGGACATAGCAACCTATCAAGCCACTGA 

>retrotransposon_07 1608bp Incyte: 1./1030, public: 1031., 1608; Tcal-like 
LTR: lb 4 8,. 14 35 



TGCTAGTATGTATTTTGGCTCTTTGATCCTGAATGCGACAATGCAATACAAATAtjiau/\i4/\in*^i^5Mik3^ 
TGATACTACTAGTAtTAATAATAATCCGAGAAACGATATCACAAAATAAATCAGTGCCCAATGAdGTTGA 
TGCACAAATATTAGTGGTGTGTAAAACTAAAGAGAATATGTCGCTATGATTTCTATTGATAAGAAAAGAT 
GAGAGATTAAGGAAATATCTTGTGTAAAGtTGTAtCGCCACCTTTTTTTTTTGtAGTAGTAGTAlrCG 
TTGGTTTTGGTTTTCtCATTAGTTAAGATTGTTGCGATAAGGCACGACCTTGATGATTTGCATGTtTGTC 
GTTTAATtGTTTTTATTTCTTTTtTTTTTATGGTGTGTGGTAGTAGTTACAGATATCGACGGTTGCAAGT 
GCACGAGTGCTGCGACtGACCGGATCGTCATGCTAAAAGATTCAGGGGTGT.GTAAGAGCGTGCCAAGTCG 
AGGAGGAACCAAGATTTCACAACTGGTTCAGGATAGGGCATTCTTTTTGTTCtTTeTATTTGATCTAGCC 
TTGCGTCTATTCGTGTTGTTGGTTGGTACAAGCGAATATCCCAATAAGGTTTTTGTTGCCTATGTGCATC: 
GtGTTGTAGCATAGTAACGAGAGATACGATTCTTCTTGTTCTCCTTCCCCTTtTCTTTGGATTGCTTTAT 
ATTTATATATATATATTGTGATCATCGtCACGAAATTCACTATCATTATCAATTATTTTGTTTTTTCTCT 
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ATCTTTGTCCTCCTCGTTTAATCGTTATCACAGTTTTGGGTTGTTGCAATTTCTTTTCATTCTCCAGTTG 

AGGCTTACACTTTCTCTTGGAGTTTCGGTTTATAATTTTTAGACACACAAAAGCACAAACTACACTTTGT 

CTTCACAGTGTATAACAGATACCACAGTATTACTAAGGGGGAAAACTAACCTAACCAAA 

AATAAGTGGAAAGACTACAAATGAGGCCCTTAATATACGAGAGAGAATTGAAAAGACATACACATAA^ 

TGGGTATAGAGAGATTTGCTAGGGGGAATGCACGACAATGGTGAGAGGGAAGTGGAtGGTCGATGCC 

GGTGGGTGGTGAAAAATTTTCTTAGAAAATTTGTTGTTTGCTtCAACTGGTTTTAAGAAAGGGAGGTTGA 

AGTGGTTTAAGTAGGACGGTCAGAAAGATtGCGGCTTATGAGGGCGGAAGTGAGTTGAAATAGAAAATGA 

AGATATAATtATATACGTTAGTTGTCGATATTGTTTTATAATAGATTGTTGAGATATTTAAATTTCTGT 

TATCAACGTATAAAACAGAGATACATTGAGTGCATTTAGTATACTGAGTGAACTGGTAGGTGTGACATTC: 

AAGATAAGTGTTTGGCGCACGGTGGGAGACGAAGAATtGCGGCGAAAAAAAAAAGAGGTCGCGAfl^ 

AACTGTTGGGAGGATTTGCTGGGAATCAGAATGAAAAAAAAAAAGAACAGTTGGTTTGAAACTTCT 

GTAATACACSMTTAAGTGATCTTTCTATCACTGtTTAAAGTATTCATTAGTCTCAAGAACTT^^^ 

>retrotransposon 08 1385bp Incyte: 1..1385; Tca2-like LTR: 49 , . 328 

AATAAGTGGATTtATCATTAGTATTATCGTAATGCTGAATCAGGGGAGTGTTGGTT.TGTGCAGTATTT 

TGTGAGAAACTGATCAATGAAAATGATGGTTATTATGAGAATGGAAAATTTTTCCATGACAGATGAGGTG 

ATGACAGAACTAAACTATATTGTGTAGTATAAATAAGGGtATGAAATACGAACATCGCAGAA^^^ 

AGATAGAAGGGAGGAGTTTGAATATATATCTTGTGAATAATAAGTTeGTTGTAATTGACTATAG^^ 

AGAGGTGTACACGGTGAATGTCAGGTAAAGAAAGTTTATATTCGATCAACAGTACTAGTATTAGTM 

TAGTTGGTTTGTCAtATACAAATAGATTAATTAAAGTAACTAAGAACCTATATGA^ 

TATATGATCATCAAGATATTGATGATCTtTATTCATTGTATAAATTGTCATtGGCATACTTGGfl^^ 

AATAAACTGATAATGCAATCGGGCAAAGCAATTGCATATAATTCAATGAGATTAAATGTTAAATGTAA^ 

AATTCCCAATTAATTCAATAATAAGCATGATTTTATGAAATGGTAAATCtTTTAATAGTTTOT 

TTTATTTAMTGTTCATTTATAAAATTTATTGCAGtGTTGTTTTTAGTGGTGGTAGTAGAATTT^ 

TCAACTTGAATATTAAGTTTTCtAATTTTACGTATTACATTTAGTAATTGAGATATGGTTT.T.CGTGA^ 

AAAAAACCAA'TATTAATAGGGAAATTTTAtTGGttTGTTTTAAAAATGGATTTAAAAATTGTGGGAA^ 

TGGTAAATTT.GATAATAAATGTAAATTATGTAATAAATTGGGAAGATT.TTCTAAAATATTAAGAAA 

AATTCTATTTTTTTGAAACTAAATGTATTTGGTGTATAGTATTTTATAGGTTTATTATTATTA^ 

TAGTGGCTGAGTTGK3GTTTGTTGAGTGGAGATTGAGCTGGTTCTTGTGGATTGTTGTGAGATGATTTATT 

AATATCAAATTTATTAAATAGTGAAGGGTATTtTGGtTT.TGGAGGTAAtTT^^ 

AATGGTTGtGATCGACTTTGTAAGTTTTGTTGTfGTTGTTGTTGTGCTAGTAAAATGGTT^ 

GTTTATGTGATGTGAtTGMGTATTAGGCTGTTGTTGTTCTTTTTGAGCTAGAAGAAGTAAATTATTGAT- 

.AATTTATTGTTGAGGTGAGTGAGGATTAGGAtGAATTGAAGTATGTTTTAAGttTAAtt 

TCAATATTGTCCTGTATTGtTGTAGTGAACATTACGGATATTAATAATAAATAAA 

>retrOtransposon 09 :1483bp public: 1-.525, Incyte: 526.. 1483; Tca2-lllce LTR: 

871, .1150 " 

TGAATAATGAGGGGATGCMGTTATTGATtTTGGGAGTATGCAATTTTAGTTGTGGTTTGGAGA^ 

TTTGTCtCATTGGTAGTTTAAAGTTAAGTGAAATTGAAATTATAGGAGTTTTTGAA^^ 

ACAAGTTGAGTAGGATGTATATATTGGATATAAAGATTCTTTTTTTTTGTAATTGAGTTTGGCAAAGATT 

TTAGTCACTGGGAATATATGGTCAACfGGTAAATGTGATAATTGAGGTGAAGTGCCTAGGt 

AGGGAAGATTTTTTGAAACAAAAATATATTTGAAAGGAACAGAGTGAAAACCTCTGTATGTAGGGTGACA 

GGTGAAAAtTATGAATTAATTGCATTGGCGAATGACAAATGAAtAGAGAAAACAGGAAATAAGGT 

AAGTAGGCCAAACAAAGTAGATTTGGGTTACGAATTTTCCATGTTtCAAAAGAATGAATTTGTTTAGA 

TGTGTGGGATT.TATTGGAAGTAA?^TGAATATGCAATTAAAGAATGAGAGATGTATTGGATTATGCCCGT 

GGTATACTTTTGAGTTGAGGAT.TTGTTTTTTTTTTGGGGTfAAATTAGTGCTCGTAGTAAAAATGGGATT 

TATGTTACAGTGAGCATTTTGATAAGTTATCTCTGGTCAATGGGAAATAGTATGGTTCTAATTAAGAGTT 

CTATGTAAATCCGATTTATTTTGATCAATCTATTGGTTTGAAGTAAGAGTTGATTTTCTG 

TTTGAGAGTGTAGTTCGGTGTGAAAAATATATTATGATGTAGACTAAAAAAGACTAAATTTCAAGTGM^ 

GGGGAACACAAAACTGAATTAATtACtATATGTTGGTTTGTGCAGTATTTTGTGTCAGAAAG^^^ 

GAAAAtGATGGTTATTATGAGAATGGAAAATTTTTGCATGAGAGATGAGGTGATGAGAGAAGTAAACTAT 

ATTGTGTAGTATAAATAAGGGTATGAAATAGGAAGATGGGAGAATATGAACGAGATAGAAGAGAGGAGTT 

TGAATATATATCTTGTGAATAATAAGTTGGTTGTMTTGAGTATAGACAACTAGACGTGTAGAGGCTGAA 

TGTCAGGTAAAGAAAGtTTATATTGGATGAGTATATAAGAAGAATGAGGGTTTGGAAAAAAAGATTTAAA 

actaatactggtaatatggaaatataagggctcgtagttgtaggcaggtggcatcgtttatctatttatt^ 

CAATTTACGCCTAATTTATGAATTAGGTTAATAAGAGGAGTCAAATTAAGACGGGTGAATTAATAGTACT 

TAATAATATGAAGCGGATGAATTAAGGGAT.CGTTTGAATAATTTGAAAATAA^ 

GGTATGCATTTTGGCTACATTTATTTGCTCTTTCTATTTtAATTTGTTTGCTAAACAGCAAGAAC 

TTGAAATTCAAAA 

>retrptransposon__10 ,879bp public: 1,.87.9; Tca2-like LTR: 326.. 605 
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rrrTrRTAGATTCGGTATAGTTGTGTAGAATAAAAATGAAAATGAATGTTAGTTGAAATGTCAGGTGGTG 

GTGGTGGT1 
TTGG 

GTTTT.TTG 
ATTTJ 
GAG 
ACAG 



CGTGT 
GGGl 
AAATW 
ACGTGG? 

ATACGGGTCAAATCCACGTCTCTGTCTACCATTAGTCTA. ... 
>retrotransposon 11 974bp Incyte: 1,,974; CfA2 (transcription factor).: 
jairi(<974y.>778,<223> .>1) , TGa2-like LTR: 483. .761 
ACC 

TACTTd 
ATG 



TT' 



TGTAGGAGAATGGTAATAAGAAGTTGTATTTCTTAATTGAAAGTTATMTTGT^ 



AAATC 

TCACACAfcAGGTGATGAGAGAAC 
CAGAATAT 



GT 



^Q^^^ ^ 

TCTGCATtATTGAGTTTGGACACTGTTTGGTCTAG;^^ 

>retrotransposon_12 3868bp Incyte: 1. .1295, public: 1296 3868; Tca2-like 

LTR: 127.. 4 07 



AAGAAGATi 
AGT( 
CAGA' 



T' 

ATAI 
CAGGAtCT 
CA' 
TAT' 
TGAACCCCA' 
TAATC 



GCTCAGCAG 
ATCGTG 
ACTTI 

GCTGTtCAACGATAG^ .. ^, , 

GGCAGGTTTAATGGGGTCTATGTTAGGAGTtGAAGACTCTGATGGATTATTGACAAATGGAATAGAGTCT 

tGtTGACTTGGCACCAGCGfTTCATAATTTGAAGGTGAAGGTACTGGGTtAGCCGAGGTTGGTGATGTTG 

AAATATCACTATCAATTCCTTGTTCTGAGGATGAGCTAGTAGCAGTTGGAfTTGTTGTGCTTeTTGCAGC: 

AGACAAATCTGATGTTGATTCTAATGGCAGTGAATTGGACAGCGCCAAATTGGGTTGCTGTAAAGAGTCA 

TTGGTGGCAGGGAGAAATCTAAATCTATCATTTGACTGAAAGTCCTTCCAAAATTCTeTGCTCAACAACC. 

GACCAGTTCCAT'TTACATGTTCATGCTTTGTAAGfTTCAATTt.TATGACACTGTTATTCTGTTCCAAAAG: 
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CTCTTGATTCAATCCCAACAATTCATAAACACTAGCTTCCTCTTCTTGAAATGAGGTTGGTATTATATTC 

CCTTCGTATGATAGTTTTATTTGTTCTATAAATGTAeGTGTGACAGAACCTTCGTCATTCTTAGCTATTA 

TTAATTGCTTGAGTTGCTTAACCGTAGTTCGGTGATTTATTTGAATCATTGAeTTTTCATTCTGTAAATT 

AGGAAGATTTGAeTCCAAGAAAACCCGGAATCTTTTGAAATTAGTATTCATTXeTAAAGGTTTGGGTTGT 

GTGATTGAAGCTAATGGTGTGTGTACTAAGTGGTTTTTCAATTATAAATATTGATGAACTACACT 

TACACTGAGAAAAACACGACCAAAATTGACACCGCACTAAAAACACGGAATTACCGTATTCTTTTTGTTA 

ACGATTTTGTTTCATTAeACGACTGTCGTTATACACACATTTAGAGCAAATTATTTTAGA 

TTAGCAACTGGCTATCGATAATAGAGTACeTTCCGGAGTTAGAATGTCTTATTAGAACAAGAATTGTTTC 

ATATAAATTfGTCGCAAAGCAGACGTAATATACTATATGGAAGGGGCTAAGTAAAAATGTCCCGtTT 

CTTAATATGAGAACTCGTGTACGACAtAATTTGCTGTGTTGTTAATCGAGTATGCTACAACCTGAAAATG 

GACCATAGACCCAAACTAGTTCTCTCTTTCTAGCACCACAAACCCCACAATTAGCACAACAAT 

ACtTCACTTGTATATCTATGGTTCATTTTCAAAAGCATATTTGCTGACTTAAGAT 

GCAAAGTGGTATTCCTAGATACTACTATCCtGGATGAAGTGGCCCGAAGCTATtTG 

AAATGTTACACATGGTAATTATGAAATATTGTCAATTGCAAATGGGCGCCAATGACGG^ 

ATATTTATGCCAGTTGGCAAGAACCAAAAAAATGGCACCAACAAAACCCAAGCCCACCATGTCAGTTC^^^ 

GAATTGAAATCGCGAGCTATTGACTTGATAT.CGGAATCCTTTGTCGAAGGTACCAGTTGCGTATTTTCTT 

TCAACTTGCATGCAAATTATTGGACTATAGGCTATTGCCATGGAATCAACGTtAT-TCAATTCCATGAGAA 

TTTGGATGATTTTATAAGGGGAATTeATAAAGCCCATTCTCGAAATCATGTATATACATTAGGCAATTT 

CTGAAGeAAACAGTGCCATTAGAATTCGAGTTTGATACTAAAGAACGGACAATAAGTCAAAGATTGTTAG 

GAGAAGTTTGTGATTTGACAGGAGAACCACGTACCATTGACACCATTTATAGATGTGACCATATACTTGA 

AATTGTTGAATTAACAGAGATAAGAACATGTGAATATGAGTTACACATAAAeGTTCCTAAGTT.GTGGC 

TTGCCGGAATTTAAAAGGAGTAACGTTGAAGAAGGTGTCTCAGAAATAGTGTGTAC 

CATTAAATTTAATAAAAAAGATCAAAAAG.TGTATGTCAAAGTATTTTTACCTTtG 

CAGTTTCTATATAAACATAGGGTAGTTCGTATATACGATATCGGAGCGATTCTAAATAAGTCGtGGAAAT^ 

TGGGCGACAATGGGATTTGAATTTTACTTGTGTGTGTGTGTGTGATCTGAATAATAGTAGTGCTAAACAA 

CTTAAAtTAAAGAAAAAAAGACAAAACAAAAAAAATTAAATGTGCTTATTGAAAATTTTtCGA^ 

TAAGGCGTGTTTATTAGATATTAGATAGTACGATTTGTTCAAGTGTCAAAGATAGCAAATTT 

TCTTCTTTTTTATATACAGCTTGTTTTAATTTCAGGATCATTTTAC^^ 

TAATTTATCCTTTTGGGT 

>retrotranspos6n_13 469bp Incyte: 1. .301, public: 302,. 469; Tca2-lik$ LTR; 
75.. 355 . 

TAACGAATGAATATAAAATACTTGTATTATGTAGTGCCAATAAAAGTTGAAACGGTCGCACTACTTTTTA 
GTCCTGTTGGTTTGTGGACTAtTTTGTGTCAGAAACTGATCTATGAAAATGATGGTTAmTGAG^^ 
AAAACTTTTCCATGACACATCAGGTGATGACAGAACTAAACTATAT.TGTATAGTATAAATAAGGGm^ 
AATACGAACATCCCAGAATATTAATTATATAGAAGGGAAGGAGTTTTMTATATATCT 

cttcggtctaattcactatacagaactaggggtgtacacgctcaatgtgaagtaaagam 

catgaagtcgcatctgttaaatatttttgtatctttttatttttatttttttttc 

catacattaacacatctactaaccatatatcacgagatacaaagggaag 

>retrotransp(DSon__14 (direct) 4 54 5bp Incyte: 1..4545; Tca3 LTR: 1..314> 

4234.. 4545, POL fraCpnent 1: 577. ,>3324, POL fragment 2: <3443..4201 

TGACGATCCTGTATATTTCGTGATAATTCAGACATTCTTAAAATTATGCACAGATGGTTGAAATGTGTTA 

ATATTCCCAACATTATCAATfATATGTGTTCAGAATTGGT.TGCAAAGTTATCM^ 

TAAACCtTACAAATTCTCTACATTTTTATATTTTTTTATATTGGGTTTTCTTTTAGAAtC^^ 

TTTTTTATCATTTAGATACATCTTTCATCTATTAATAGAT.TATCTTTCTA7ATATGAAAACACGACAC 

,TCAeGTGeCAAAAAGGATATAAGAAGGAACTTCAGAAAAtTAATTTTCTG.:i.TTATA^ 

GCATAAAGTCAATATCTGATTGATACAAGTTGGTTCATTATTCATAAAACTTAACAACTAA^^ 

GAAAGCCAACAAAAAAATCCAAATAAAATAATCAGGAAAATATTATAATTAATTAATTACA^ 

AAAAAAATACACACACACATACAGACACACAAAATCTTGTTGCAAAAAAA.^ZV^^ 

TAAGAATTAATTAACAATGTCGTTTCCACGGACACAT.TCACCAAGACCATCTGGTTCACGAGAAeAGGAA 

GATCTeACACTGATGATTAAAGCTTTTAGAGATTCAATGGAAGCTAAGCTTGACTTGCATTC 

TTAGTGCTTTGGTAGCAAACAT.TCCCAGAACGGACGAAGGGTTTGMGATTTATCACAAAGGATCACTG 

TCTTAAAAATCATGAAAAAGCAtTTTTGCCCAAACAAGAAAAAGAiyVTCGG.^^G 

AGAGAGGAAGAAGGTGATAT.TAAGGATTTCAAAACAGTCGTTGGTGAAGA.^J^GAAGAA 

TTGAAGATTTCGTTTTAAAAGATCAAGAAGAATTAGGAAACGTCGAAMG.hAAGTTTTGAAAGAAGAA^ 

AGAATTGCAAAAAGTGGAAGAGTCAATGGAAAAGGAAAAAGAAGAGTTATACCAGGTTGAAGACTTtATT 

TTGCAAAGAGATGAGACGGTAAAGAAACTTGGAGAAAGCAATGAATCTC>AeAGGAACGA 

CAACtTCTGGTTGGGATCAGAGATTCAGAtCtCAACAACCTAACATTGG.-JiJVTA 

AGCATTAATTCCAAAAtTAGATCTGGAAATTTGGAAAATTGCAGTCAAArATGCAAAATTATTTGAAACA 



FIG. 71H 



AAATTAAGACCACCACCACGCAGAGAGTTTCAATATAAAATTCAACTCACAGACCACACTCAAATTTATT 

GAAAACCATATAAATGCAATGAAGAAGAACAAGCTCTeAttAAGGATTTCATC^^ 

AGGCGTTTTGGTACCAGCTCCAATTGATGCTTGGTTAGACCGAATATTTCCAATCA 



AG 

TGACCAGATGTGATTAGTCAGGAGAATGATGGAGAAACTAAATGAGCATCAGTTTCAAATGAATT^^ 



ATATTTGCAAAATTCMGCAATAGAAAATTGGGAATTGCCCAGGAGCACM^ 



AGATGGTAGCGACATGGTAGTAGGAGGATATTTATGtGAAGGAACATTCAGAAATGACAAAGAAGTGGTT 
GTGCCAATTGCATTTTCATGACATAAATTAACAGAAACACAAAGCAGATATGCTGCTATGGAAAAGG 
TTTTGGCAATTATTGTGATATTGGAAAAATTtAGATATCACTGCAGGAATACGGTAGAGATCTA^ 
TTATCAAAGTTTGGGATCATATTTAGATAAGAAAAGTACTGCACGACGGAGAATTGCTAGGTTTTTAGAT 



GAGACTAGTTATGGAGACTCGCATATTGGCATCCtGAGGATCTATTAATTGCTACAAAGAXTAGGAGAA 



TTAGTAGCCGTGGAATATGTCACTGGTTtAACTATTGCTVGTACGAAGATTGC^ 
CAAI 



CGACG 
A 
C 
A 

AAC 



GGAGAATGGGTATAGAGAATTAGAGCTAAAGCAGGAAAATATGAAGCAAATTTCGATGGTGGATATCAAG 



TTAAAATTATGGAGAGATGCTTGAAATGTGTTAATATTCCGAAGATTATCAATTATATGTGTTCAGAATT 
GGTTGCAAAGTTATCAAGTCAATTCACGCTATATAAACCTtACAATTTGTGTAGATTTTATATTT 



TTATC 

>retrotransposon 14 POL fragmeht 1 9I6aa 

MSFPRTHSPRPSGSREQEDLtSMIKAFRDSMEAKLDLHSQKLTALVANiPR^^ 

KAFLPKQEKEIGSLLHRQREEEGDIKDFKTWGEEKEELHQVEDFVLKDQEELRNVEKKVLKEEEE 

EESMEKEKQELYQVEDFILQRDETVKKLGESNQSQQEPYTPATSGSDQRFRSQQPNI^G^ 

LDSEICKIAVKyPKLFETKLRPPPPRDFQYklQLTDHTQiySKPYKCNQEEQALIKbFINE^^ 

APIDAWLHPIFPIRKtNANQSSTKIAVDLRRLNKVTVRMYTYPTDTKDLLSSLTDSHYFSALDLKNAFYQ. 

VSIHKDSIKYFGISTSEGNYCFTTLiPFCy^INSPTIFTNFVRQILEGIPGIFIYMDDlLIKtKTLHD^^^ 

LRRIMEKLNEHQFQMNYNKMQLLTTKINFLGYSIQANKISPDISKIQAIQNWELPTTTTQIRAE^FS 

FRIFtPEIAKFTNPLNELLKNNNGKNIKIEHTQASIDGYKALKAAXIGLPTLQ^ 

VVGGYLGQPTFRNDKEVLVPIAFSSHKLTETQSRYAAMEKELLAIIVILEKFRYHCSNTVEIYTDYQSLA 
SYLDKKTTPPPRIARFLDLIGSFSPKVYYLSGKKNFVADIITRYQTQNIKELVDEDKIL^^ 



FIG. 711 



QQLLPRLEAIELENLNESQVHKIQTSLEQQQQHDLEDNDEELPLQSFKLMNDELFVIINNQLLKYLPRSE 



WGMDYSGPYFNTVQHRYILVAVEWTGLTIAVPTLHKDADNAISL^^ 
SFGYPM 

>retrotransposon^l4 POL fragment 2 253aa 



EQQEEGREQQISREEQQDGRDLVHLRIYEI^AIECKARKLHTNLKTRRNAVQNMLKE 

YRIRAKARKYEPNFDGPYQVQEVLGKGAYKLRDITGREKGIYNQPQLKIAYSADNDPIQVFSSFNi^ 

VQQKLLDKIQSERDHQLNGLSVQHLHRQRRLLDISSCLEQISQ 

>retrotransposbn_15 2093bp Incyte: 1. .2093; Tca3-like LTR: 1509.. 1822 
TTTTCCCACAAATAATATCAACAATATTTCATATTTTCCATCATGCTAGAGAAGATCAAG^ 



CTGAAGTCAAATTAGATAATAAAAeCGAAATTTATGTTAGTGATTATGCTTGTTeATTTGGTCGTGATTT 



CTACTACTACTACCAATGATAATAAGGAAGGTGATGATGAAAAGGATAATAAGGAAGCCACTGTT^^^ 



GATCTGTTTCTTTCAATATTGAAAAATTTAATTGATAATCAACCTACTGAAGAAGAAATTC^ 
TAGCAGCTATGGATTGTATTAAATCATTAGATATCTTGAATGTATTAAGAATTGTTGCTGAATCCAAGAA 
ACAAGCTAACTAAATeTAAACAATCTAAAGATGTAAACATGTAAAtATATATATATATCTATTGTA^ 
tATATTTGTAAAATTTTGTAGTTTGCAGTGGTTGGAATAAATGATAGGAGGATGTTCCAtTTGTGATACA 



GGTTTACAAGGTACAACAAGAACATGGGTATATCACCACGATAGTTTAGTAATTTTGTAAATC^ 



CAAGAATAAGCTAGCATTGCATAATGGTAGTGATTGTAGTGAAGAGAACAATACACTAATCTATTeCATT 
GACGACGGAATAAGTGGACTGATAATTCACATGGATAATTCAGTCCAGTCTGAGAGGAATTTGC 



TAATAGATTATGTTTCTATATATCAAAACACGACACAGTCACGTGCCAAAAAGGATATAAGA^^ 



CGGT.TTGAGGGAGAAACGACGCTCAAACAGGCATGCCGTCCGGAATACCAGAGeGCGCAAtGT 
>retrotransposon_16 2d99bp public: 1..2099; Tca3-like LTR:. 1565. .1878 



ATGCTTTACTATGAAACTTGTTTGTGTTGTGTGGATTGGGCAAACAAAGATCATGGTGATATCTGTAAAT 

CTCTGGAACGGGGGATAGGAATAAACttGAAAdAATA^AAACGAGGTGTTTTGCTTTTG^^^ 

TTGAAACGTGtACATTCCCTCTTTTTCTCTTAGTTAACAATATTGCATAATAGTGAGGATGTGAGGGTAA 



FIG. 71J 



ftartr^gractagtatgtgttgaaaaaacagacaaattaatcgggataggaagagatgggaaaggggggtg 
agaga; 

TCTTCl 



AGAGAAAAGCAAAGAAAAiU^AAAAAAGAAAAAAAAGAACAAAAATCAAA 



TTTGCTTAi 



TT' 
T 
CTT' 



>retrotransposQn^l7 3284bp Incyte: 1..2749, public: 2750. .3284; TcaS-like 
LTR: 2750.. 3063 



TGTA* 



.GCTCTGATCATCAATTCTTGAGACTCCAATCAACCAATTTAACTCATCTGAATGATAC^ 



CGCTCTCGTCTTCAAAATCTGATAGCAGTATAGAATCCATAGAATCTGTAG^ 



GA' 



C' 

CCGGGT 
CG, 
TA' 



CGCAGCATGAACTGTCTGAT ATGTTUT'i "i- U iiiAT XTUi 1 1 i u^x i ^ i ^ j. + v f ^CCAATGGA 
ATCGCTTTCTGGTTCAATTTCTCAATTTTGCGATGCAAATGATGCTGTTCTGTTCGTTTC^^ 



ATA1 * ** **" 

TCATTTATAGATTCATTCAAAAA 



CATCCT 
T 



TG 
A' 
CAi 
GA< 



AAAl 

GCTCTGtTGTAGAAATTGTTTGTCTCTACAAACGAC 



tTTAGATTCTAGATGTAACAGCAGTTCTCTGTAGCGTGTeAAAATATCAA'rTGTGGATCCAATAeAG 



ACATCCTTGAAATGTGTTAAT^^ 

CAAGTCAATTCACGCTATATAAAGCTTACAATTTCtCTACATTTTTATATTTTTTt 



FIG. 71K 



ATATCAAAACACGACACAGTCACGTGCCAAAAAGGATATAAGAAGGAACTTCAACCTGTTCTTTTCTTTT 
TTATTTTTAAATTTGATTATTATTAATTTTTTTTTGCT.TTCTTTCC.TTACCA^^ 
TATTCAAAAGGTGAAACAGGGATTTTCCAATTCACATAGCCAAAAGTATTTTTGGTTTeC^^ 
AAAACAATATTTGTGCTACCTCCCCCTTCCCACCAAAAGTATCCGATTCCAACC^^ 
>retrotransposon 18 791bp Incyte: 1..791; Tca3-like LTR: 277.. 590 

aataatgtcmtttattaccaagtttccaaagttgtgt.tgttggtagattata 

tacgttataaaggtactaataatgatcaaaatgaattxgctgataatatagttaaa 

attagtaggataaataaagaatcaataagcatggcacgtgaatatgaaaaggta^ 

taagtgtagtgtataaattacaaaacaMaaaggctgttgttattaagatgagtc^ 

gatcgtgcatatttcgtcataatxcacacattcttaaaattattcam^ 

tcccaacattatcaattatatgtgttcagaattggttgcaaagttatgaactcaat 

ccttacaatttctctacatttttatatttttttatattggcttttcttttagaatcaatc^ 

tfatcatttagataeatctttcatctattaatagattatgtttctatatatgaaaacacg 

gtgcgaamaggatataagaaggaacttcatcttgattgcgccgcaagcaaeaaa 

AGTATATACTCCAGATCTACTATGAGTAfGACACAGCTTATTAATGATGAAGTCTACAACTTC 

AAACACGTTCTTAACA7^TCAAACAGTATTCAATTGTTTtiy\AA/U^CAC 

AAACAACTAAAGCTAATTCTA 

>retrotransposon_19 4581bpi incyte: 1. .4581; Tca3-like LTR: 272S. .30.37 

TGGGAATTATTAGAGGAtTCTTTTTCAGTGGATATATAAATAACGAATAAAT 

AAGGGAAGAAAAAAAAAATAATCAAACAACCAACCCTCTTTAtAATTAACAAGACTACAACTT 

ATGGGATATCCACCAAATTTGAAAATTGTTAGTAAATGATTAACAGAAAACATTTTATt 

CTTTTtCAAGAGTTGATAAATTCAAtTTTGGTGCTCGTATGGCGGTATTTAAATTTCCTCAA^ 

AATGATTTTATGGTCACCATTAGCTTATACACCACAAGTAATTGATGTTTTGACAAAATT 

ACGAATGAATCAAATTTAAATATTGCTTATGTGATAATTCCTGATCGTGAACATAATTTAGC 

CATATAAAGAAAAATTTCCCGGGTGTAAATTAATTGGAATGGMGGATTAGATGAAAATTCATTGAAAT 

ggattataaatttataaaactgatgggtaataaagttttaaaaaatgatgaattaaaacaaatgtttaat 

gacagtgacagtggcttgattgttgatmttttgaatttgtttatttagcaaatcatgca^ 

tggttgtatttgataaatcatcatcaacattatttgaaggggatttattattcaatttaggt^ 

gtcaactgtgggtgaaagcattttagaacaatattcaccagagttggggttccctaMg^ 

cattctggttggtcatttataactagatatttacaaccatattctaaagttggtcgtttctta^ 

AAATTGTTGATATAAATCATAGTAAACCTGGATTAGAAGCTATTTATAATTCATGGG^^ 

tgttatgtgtcatggaaatattataactaaagatgctaaagaagcatttaaacatgtttttgt^^ 

taaaagaattgaagaagatagtcaaatagtaataatcagaatatatgtatgttttt.ttttgaagaaaatt 

aaagaatatat.tgaggaaataataataataaaaataaaaagactaactattttgaatag^^ 

GGCACTATTTGiyVTGAGATAAACCAATTGTGAATATACGtAGATGCCtt 
TGTTGAACAATATGTGGGATAMTAGCATTTTCATCTGTGCCATTGATATTGCATTT^^ 

gaacagtgacagcacctgtggcggtggctattacataacagaacaagtggaagagca 

acagatctaacagcattgtttttagcagcaggatctttatctttggtttgaccagatggagttt^ 

attgttgttgagcagccattttttatttgaatttgttgiattgagt^ 

ttacttgtttgagttgttgattaagaatagattaaacaaaaatatacaagagaatctgtagacat^^ 

tactcatgaatttatatatatatctatgcttatattcatttgatgt^^ 

caagaggtttgattttgatttgtctgcaaaaaaaatatgctctatttttcgcaattagcgccgm^ 

ccctcacaaagttcggagtttagttggaaaaatgtttcgatagagtaaaatttcaggaacaaaattgac^^ 

AATTGGGAGATGACAATGAGAAACAGTTTTGAGACTTGATCATACTTCCCCATAGGCTCACCTCTTTACG 

TTAAATATAGGTCTTTACGTTCTCTACAATAATTTTTTTGACTTATTGATATTtCtTAAAATGGTT^^ 

GAAATAAAACAAAGAGATTGATAGGAATATTACTTTTTCAGGTAGACAGAATGCAGCTM^ 

GTCAGGAAATATCATTCAAGCTTTATCTGTTAGTTAGTGCTGTTATTTATtACTGGTGAACTACACCAAA 

GCATACTGAAGGCATTTTACGAGGTTTTtGAAAGCTCtTACTATGTAGCAACTCATCT^^ 

AGGAAGTGCATCAAGTAtGGATCAAGCAAGTGTTAGeXTATATCAtTGGTTTAAAGATTGTAAGACT 

TTCGAAAAAAAAATTAAGGTTTCTACTTACCACTTTeATGTGGCTTAAAGTtGTGGATGTGATATTGAAT 

AtGTTTCAGATTTGTCATGAAACAATAAGAACAATAATAAAGAAGAAATGAA.ATCAATCTTCAATGTAT 

TATGTTTCTGTATGGCGCATGTGGGTTCTTTGTTTTAAAAAAAAAACTTTAAATTGAGTTTGTTTTTTCT 

TTCTTTGTTAGTCAATCAAAGTTTAAAAAAGAAGAACAAGTAGAAATAGTATAGTAAAttGATAT 

CTTTTATTACTAATAACAAATCTTTAATGGAATTTATCTGAAATTMTTGTCAAGTTTTAA^ 

GATTGATATTACTCTAAAAGAAATGCTGTGTGGGGTTGTTTTGTTTGACGTGAAGTGTCCAA^^ 

GGTTCATGATCtAACTCTTTGTACTGCTACACGTACATTGGGAAATATTGACGTXATAGTAACAGTtACT 

TtCTTTTATTAATTGTCTAAACTATGCTTTTGATCAATTCACACGTACTTCATT.TCTTCTCCGGTGACGA 

TCCTGCATATfTCGTCATAATTCACACATTCTTAAAATTATGCACACATCCJTGAAATGTGTT^ 



FIG. 71L 



CCAACATTATCAATTATATGTGTTCAGAATTGGTTGCAAAGTTATCAACTCAATTCACGCTATATAAACC 
TTACAATTTCTCTACATTTTTATATTTTTTTATATTGGCTTTCTTTTAGAATCAATC^ 

TCATT 



GAGi 
TT' 



ATTAT' 



GGAGGAGGTTTGATGTGGTGGTGTCATATCA 

>retrotransposon^20 5325bp Incyte: 1 2386/3779 4807, public: 
2387 . . 3778/4808 . . S325 



GG< 



TGGAAGT 
CAA' 



CAGAAGCGGAGTTTATGGCTCTCACAGAGT.GCATAAAGGAAGCCCTTTGGCTAATATACATTTTTGGAGA 
TATTAATGrGATATTGAAATTACCAATtGTGATATATGAAGAGAACGTACTGTGTCAGAAATT^^ 
AATGCTCGATTCCATAATAGGACAAAAGACATl'GAeTTGAAATATAAATTTACCAAAGACCATATAGM^^ 
CTGGtACAATGAAAGTGGAATCAACTAATTCAGCAGATAAGTTAGGGGACATGCTAACTAAACCTTTACC 



TACAGAATGTTACCAAGAAGGTTACACTTGAATATAXGAATGACTAGAAAGTGAATTGAATGTTA 



■G 
TG. 
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TTACTGAGAGGAACTTCAATTTTCAACAGGTTATTGCCTCTATCTCCACTGTGGACAATCAAAGTCTCTT 

GAAGGAT. 
TTTCTTdACTl 
ATGGTC 

S55MGfeTACCAA^^^^ 
A^^CATTTCTTATGCGTCAACCTCAGGACCTTAAACCTGCCCtTtTACTTATTGCGGGJ^^ 

ArCTTTGAATGAAACATACTTTCACGATAACAAAGAATTAACGATCTCTAA^^ 
AATCAAAACTCC 
TTACCCAG 
GGGCCACACTG 
CTTGG 

CAAAd - 

TCCy^CGGdACGTeTTTGGATGGGeGGCATCATCTGACCAAATC^ 

TT1 



ACATGGTC 
CCCAG 
GAGAAATTG 
tCATCTT 
GCTTTC 
TCATG 
CATTACa 
GTTCATC 

CAAAATAC — - 

TrATTGGGAAJ^GTTCTTTCTGGGAAAtGGCAATTACCATAG 

GAATTCT1 _ _ 

^ r.-. m'A"rp7"n"7i »V^'rtrr:rTGraGa ArGAGflTATT AGATCGGTTAAAGACATGGeTGGAGTAATATT 



GCTTCAATCCAAAT' 
CTTGCT* 
TGATG. 

71^' ["pn*, 

cgaatattCacat'cctcacaaataatatgtc^^ 

AAd 
TCCA< 
CC 



TT' 



GTC^ 

AACAGGCTGC - 

TGCACTCGCGTCAAAATCCAAACTAAAGATTCATTCCATAGATGTTACCAG^^ 

ATACTG 
AAGCTC^ 

ttat; 

AXGGG 

>retrotransp6s6n_2i 2 02 7bp public: 1. .624,: Incyte: 625.. 2027; zeta-iifce 
i384,.1891 
TTTC 
GTCTGC 
AGTGTi: 
TCTTl 
ATTGTT 
AG! 

AAAAGAG? — - 

TGAAATTTVTWTGTGTTGTGTTGGGTTTGAATTtCtGTATAACTCAATTTGGAGATTTTTTTTT^ 
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CTTTGTTTTGTTTTGTTTAeeTTGTGATAATTTTATACGTGTTGAGAGGGCTCTCGTCGTGCCCGTGTCC 

GTTTCCGTGTGCTGTTGGGTCCCCTCCGCCCATGCCGCACCGCACCGTACGGTAATGATATCTGATTGTT 

GGAGCGTTCTTCGCTAACAGGTTCTTTATTTTTGTTCGGGGGTTTCGAAAG^^ 

GCtTATMCTGAGAGTTAGAGTAGTGGAGATTAGTAGTAGTAGTACAATCCTATAGCCCAAACATTAT 

GAGAGATCTtACCAMTAGCAATCATCATGATGTATTTACTACtACATAA^ 

CCAGCAATAAACAACATGACCAACTAATTAACAAACATTTGAAAAACATAAAGT^ 

AAGTGTACAACCAGTGTGGAAAAAGAATGGAATTGGAATTGAACAAAGTTATTAATT^^ 

ATTTAATTTCTTGAAAGGCAAATCTTtGTTTGTTTTTtTTTtTGGGTCTTTTCTTTCATTT^ 

GGGGtATTAATAGATAATGATATTGTTGTTGTTATTGTGATATTGTTGTGAAAra^^ 

TAAGTTTCTTTCTTTTCTTTCAACTAGTATAATTGAACTAAAGAGCACCAC 

GCAACCTGAtATGCTGTTCATGTAACAGTAAATTATCTTGGTACTATACCACTTGtTC 

TGCTAATTCTTGATTAGTGtGGAAAGCCTAATAAGGTTATATTGTGCACAGGtTAACTACCTf^ 

TTATTGTTAATACAGTTATTGGTGTTGACTACTATTG 

TTGATTAGTGAAAACCAACTAACTACCGTATTAAATTATTGTATTAAGATTGATTCCtATTAAG^^ 

ACAGAGAGTGTGTTAGAAAGAGAAAGGGTGGATTATAAATATGTGTAAAATCCCCTTTAGAGACTAACCA 

CTAGAAATCTATTGATGGTTTCATATATAGAGATTAACGATTATATTTAtMTATAAGt 

AGfATATTTGAAAGeAGTACAGTATAGTATGtCAGAATCAGATCATTTAAACT.CTACTAATAATACAGGA^^ 

AACAGT.TTCAT.TAGTCTAGATCAAGCeAGTACAATAATGGCAGATCAAACTCAAGGAGCTA^^ 

AATGATAATTCATCTTTtTTGTCAAGACGAtAGGTTAATiSTTACAAGCAC 

GGTAAATAAGteCATAGATATGACCTGTTACAAGTTATTTCGATGATCMGCGGGCT.eTGTGATTAC 

>retrotransp6son_22 2118bp Incyte: 1. .211B; zeta-like LTRr 1419.. 1927 

TTTtT.TTAAAGAATTAATTAAATATGATGGATGATAGAAATTAAAGGAAAM 

AGTTTAATTGAAAAAAAAGGGAGAAATGAATATTGAATTATTCAGCTTTTATATTGCTGATAGATG 

AAAAAAAAACGGAAGAATGGGGATAGCAAAACTGTGGGTGAGATTAACTCATGTATGG 

TTTTTTTTTCTCTTTTATTAGGGGGCACATAAATTATTCTTTTCATTGAT^^^ 

TTCAtTATTCGGAATATATTACCGTATTGGGAACGATAATTATTATTAGTTCTGCCCGATGGTTCGATTT 

TGCTGGTGCAAAAATATAAATGCGATATTACTTTATTGGTGTTTfAATAAATCCGTTTTA^ 

GACATATACAGGATGATAATAATTTMCCGATTTATAAGTTGGAATCATTTGGATGAATCCGC 

gacgttttccaattttagaagtttaagtatgaattttatgtgacatccgagtgtacacatttt 

tgatcttatcaactcacttggtgtaccatggcatttataacaacactttttagaatcggctga^^ 

gcatttcctetatttgtagattaatggaaattcataaaatcgttcacatttttttgtataat 

TTCTGTTTGCAtAAGTAGGGGACTAAAAAATAATTGATATGTCTMTCAGTGACAGCTCTAGTCAAGTTG 

ACCGTAATGTTTTGAGGACCATTATATTTCTTGTTTGAAeTATTGATTTATGAGTGTTGTCGTAACAAAA 

GATCMTTCCCGTCAAAACGCATTTGGGAGTTAATCTTTGATTGAACCGATTTTGATGTCAAAAG 

ACCAAGGTCJy^TTATGTTGGCTAATGAAAGAAAGCTGTGACGAAAACCrCAAATTCATGA^ 

ACtGTTGTGGAAAATAAAAAAGTCTTTCTTCTGATACTTtAGAAGTCCCTCAACCACAAAT^^ 

AAAGTTACCCATCGATCTTTTTCATTGGTTAAGAATTAATAGGAGAATATCAAATTATCTT^^ 

CTCACAGAGCAACTTTGTGAGGCACACGGTCACCAACATGAT.TTGTTATAA.2y^TTGAACCAAAT 

GAAAAAATGAAAACAAAACAAAAGAAAATCTGAAACATGCCGAAAGTCACAAATGCTTGATT^^ 

TTACTTATTTGCTTGAAGACGCTATTATTAOTATTATGACATAATACT^^ 

ATTGTAttAAGAACAAATCATAACAAAGGAAGATGATGACGATGATGAtGACCCCTTGAAATATGGAGGG 

CACATGCATTGTGATGATTGTTGTAATATAGCTAATGGTAATTCTTGATTAGTGTGGAAAGrc 

GTTATATTGTGCACAGGTTAACTAGGTTAATATAGTTATTGTTAAtACAGTTATTGCTGTTG 

TGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTAATTGATTAGTGAAAACCAACTAACTACCGTATTA^ 

TTATTGTATTAAGATTGATTCGTATTAAGGATAAAACAGAGAGTGTGTTAGAAAGAGAAAGGGTGGATm 

TAAATATGTGTAAAAATCCCeTTTAGAGACTAATCAGTAGAAATCTATTGAtGGTTTCATAT^^ 

TAAGGATTATATTTATAATAtAAGTTGGTAGtTGCTAGTATATTTGAAAGCACTACAGTATA 

GAATCAGATCATTTAAAGTGTACTAATAATACAGGAAACACTTTCATTAGTGTAGATGAAGCCAGTA^ 

TAATGGGAGATCAAACTCAAGGAGCTAACCCAeAACAATTAGGATATtATATGAAGAAGACTATM^ 

ACTGTAGATAGTAGGGGATTGGTTATTTCCGGGGAGTAGMGTATTGGGTTATCTAAGTCAAtCT 

AACCAACAATCAACAACAACeAACAAGGTTTTTCCTATTCTCGGAGATAACTTGATTAACTTA^^ 

T C T T GT G AAAAAAT TT CT 

>retrptransposon 23 4 929bp public: .1..4929; zeta-like LTR: 2??0,.3497 

TAATTGGeGTATGAATGAGAXfGATGCCAGTGTTGGTGGTGAAGTTTTAAAAAGAAJ^ 

ATGCAAAACAATAATAGTAATAATGGAGGGAAAAGATTTAAATCAGATCCAGTTTCTGATCAAGAAATA 

TAGATGCTTGGGAAAATAATCAATTGGATAGGTTTTCAGTGGATCMTTGAAGGCATTTAGAAGAAAATA 

TCCTGATGTCAAATGAGCTAATAAGAAAGCtGACTTGATTGAAAATATCAGTGAGTTTAtAAG 

AGAAAATGAGTtAATATGTAATAGTGATATG.TTTATAGCTCTGTAAATACATGTAAATTTTTTGGTTGCC: 



FIG. 710 



AATGAATTGATTGAGACTGAAAATCGTTTGTGGTTTGCCA^TGAACATTAAACTTM 

AG 
TAI 
CAT 



TCTAACSGATCGGGTGTTCGACTCACtCCGGGGAGATTTTCTTTTTTACGACCACCATAGTTAAeACGCTA 
CCATATGAGACAGAAAtCTAGCATGAATGGCTTATATACAAGTGGACCATTTAGAAG.CATGAGCTGTGTC 
CTAGTTTTTTATCATTTACAAtTGAATTTCCCTCTGAAATTAJVVATTCTAAGGTATTGATTTAT 



AA1 
V 
AAAAi 



TCAGATTTGTTGATAACGTTTAATTACTTAAATTTTAGTATGCATATT^ 
GACGAT 



CAAGGAATTGATTGAATGTATTCATAGCAAAATAGATTTAAGACATACAAGCTTAAACATGGGTTATTCT 
CTAGTGGTGTTGTTGTTGCGATTGTAAGAGTCCAATCTATGATTAATAATCGGATCACCATTTGCACATG 
AACTACATTAAGTACTAAAAAATATGCAAtTCGCCTGTTTTCTTATTGATTAAATTTAAC^TAAACTTG 



AGTTGCtGTTGAAAATTTTGTTCAAGACTCTTCACACAGCATAGCAAATAGTTATACATAAAGA 

TTG 
TGAl 
AT 

AATTC 



TGTtAAtAeAGTTATTGCTGTTGACTACTATtGTTATTGTTAAATTAAAGTGTTAGGTTGAGTT^ 

TTAGTGAAAACCAACTAACTAGCGTATTAAATTAGTGTATTAAGATtGATTCCTATTAAGGATAAAACAG 

AGAGTGTGTTAGAAAGAGAAAGGGTGGATTATAAATATGTGTAAAATCCCCT.TTAGAGACTA^^^ 



TAATAGATtTTATTACTTCAGGTGCTTAtTACACAAACAAGGTTG/^TTGATA^ 



TGCC 

CAAACAGTTTTGTACT 



GATGAAAGGATTAAGGATTAAAGTTTGCAACGAAAAACAAGTGGAACTAAAGTTTGCGTTATTGTTTTGT 

tCGGCTTACCTAATGATGTTTACTCCTTAGAACAAACAACATCAACTACTTTTAATCCTGACGACGAAGA 

AGAAGACCAAAAAGAAtAATTAGCCGCAGGTACGGTGGTGGCACTAGTAGTAGTGCTAGTGGTTGTTGTG 

TCtCATCCAAGAGAAATGGAAAAACtGCAAAAATGCCGCAACTTTGAACATTTTGGAACACAATAGAACT 

TTTTTTTTCCTTTTGGATTTACGATTAGCGCGATAGACGtGACCATAAAAATACCACA^ 

CCTCTAAAAATAATGTACACATTTCCAGGeTTTTGTTTAGTGCTTAATAATTTGTCATCATCGGTAACAA 



FIG. 71P 



TGATAGTCTCCCCACCCTAACTACAGTAGACGGAATTAGACACCAAAGATCTTATAAATCAACCCCAAAT 
TTTGGCATTTTGATTTTTGATTTTTTCGTATTCCTTGTTGTTTCCATAATTTTTTAGTTACTCqT 
ACTAAACTAGATAACTCGTCACAGTTAACAACAGAAAGGTATGTTAAATAtTTATTTCGTTCTAAATTCA 
AGTTTGGTATAGAATATTGCAAACAACAACAATCTGAAAAATGGAeTTTAATTTGCTCTAC 
ACACATCTAGAATTAATATTTGGTCTGGAAACCGTATA^ 

TGTATl 
TTT 

CTCAACCTCCCCATACTGGGAGTACATAT- 

>retro.transposori 24 4954bp public: 1..4954; zeta-llke LTR: 256;. 763 

TGTTATAAAAAATTCAACCAAATTTTGGAAAAAATGAGAACAAAAeAAAACAAAATCTGAAAC^^ 

AAGTCACAAATGCTTGATTACTTAAAATTACTTATTTGGTTCAAGACGCTATTATTATTATT^^ 



CTA' 

TGi 



GTCCA — 

tactat?gat}^tgagtaamgttc 



A 
AG' 



Ti 
CGT' 



G' 

CAATAT' 
TTTT^ 
TTATAt 
ACTGTG' 
AAAATTT 



CCCCCCCTTCTAGCTCCTAATAAAAAAAACCCACATTACTATTATATTTAAAGT(3 

AAAAACAI 
AT 

GCCA 

AATTAATLi^ J. j.jT.Av-fi**> .w. — 

caaaacaaataaaa?j5{aag^^ 

TTGATTCAAGTATAAGTTGAGAATGATTTTCGCAATTTATTAAAACtACATACAAAAGAATATTAACCTT 

TCTATTTTCTTTATTTTTTCAATTTAAAAGATATAAAATGGTTTCACCTTTtCTTTAAAATTATAATTTT 

GAAGACTTACCTTATTTGCGTTTTCTAATCGCGTCCACTCCTTTAtTAGTACTATtAGCTTAAGTCTTTC 

GTTGAAAAAACAACTACAATGCGTGCCAACTATTTGTTATTATTAGCTGGGAGAGGTGTTGAAGCTGCTC 

CATTCATTAAGAGATATGAAAACACTACTGCTCCAGCCAGTCAATTGTCCACTTCATTGGCTGATGGTTC 

CACTACCATTGTTGGTTCTTCATCATCCAGTGTTGAAGAAGATGAAACCATCACTTCCAGTATCGTTCAA 

TATGTTACtGtCACTTCTTCTGACACCACTTAeGTtTGTGCGACCAACACTTTGACTACTACTTTAACTA 

CTAAAGCAACCCCAGTTATCACCACTGAAGCTGAAGATGACGAAGAAGACAATGAAACCATTACTTCCAC 

CATCCTCCAATACGTTACTGTTACTTCTTCTGACACCACTTACGTTTCTGCTACTAACAeTTTGACTACT 

ACTTTAACTACCAAAGCAGCCGAAGCTAGTGAATCCGAAGAAGAAGAAAACGAAACTATCAeTTCC 

TTCTTCAATACGTGACCGTCACTTCTTCTGAGACCACCTACGTTTCTGCCACCAACACTATAACCAGTGT 



FIG. 71Q 



TTTGACTACCAAAGCAGCAGTATCTAGCAACGACGTCAGTGAAAATGCCAAGGCTGCTACTACTGAAGAT 

GATGGTGAAACCACTACTTCAACCATTACTAGTATCGTTACTATTACTGATGCCAATGGTAACAGCGAAG 

TGTTGACCGAAGTTGCAGCTGAGACCA^BTGGTGCAGAAGATGCTTCCTACTGTGTTCCTTCTACT^ 

TGTTACTG.TCACTGCTGAACAAACTTCC.GAAGTTGTT.TCAAGTATTGTTCACACTACCC^^ 

ACTGCTGAATTTACCGTTGATGATACCACtACTACCCTTACATGTTGGGTCGAeTTGACTTCTAeAGATC 

.TGGTTACTATMCTTCTACTTGAAGTGtCTATGATTCATACTCAACTGGCGTTte 

TCCTCATACTCGAACTACACAATTTCGGACtATGCCCCACCAATCAGT 

GTTGATAtGAAAGTTTGTGATAGTGATAGTACTACCGCCGCCACCACCACACCT^ 

TTTTTAAAAAAATCATTCTGATCATTTTTTTTTTATTGGT.TTTGGATTTTATGTCGTTTTTGACGTTAG 

CATTTGTTTTTATTGTATTTTGATAAGTGGGTTTATTTGAATTTTTGCTttTTTTTATTTT 

CATTGTTATTCCTTTTTCCttTGAttATTCCTTTAGtGGTTGGTGTT 

TGGTTACAtTGTTAtATTTGTTATTCCTTTGTTAGAGTTTTTTTTTATTT^ 

tTTTTTTATCATTGTCTGTCTTAttCAATGGTTTfGTAGTCTAAAAATTTTGGTCTAGTTG 

ATGTCTGTTCATTATCTCTATCeTTTTCTTAGAAACATCATTCTCTGTCTTTGTCTCTAACATTCCTCTC 

TdTCATATTCTGTACAATTGTCtAGATAGATTTTTTATAGTCGTTATTGT.TTTTTATTTCTCTAACT^^ 

TGTATCATTTtTTATTCTTTTACATATATCTTTACTCTTCTTTCTCTTTTTATTTTTTTTGGATATAATA 

AATAAATATACATTTGCCGTGtTATATTGAAAGATGGATTGATATTGGAATTGGAA^ 

GCAAAAAAAATAGCAAGCAAAAAAAATGACAACATCAACAACAACCACGAATAGGAGAAAAAATAAA^ 

AGAAAGGGAAAGAAAGAAAGGAAAACAATAGAGGTGGTTTGATTACATAAGCAACCAAAATTTCtCGCGT 

CTtTCGCTGTGTTTGTTTTTCTGCGTtTGAAAGGGATGACAGCAGCAGAA^ 

ACACCTACif^TTCTTCATTTGTTTTGAGTTGGCCGTACATTGAAAGATCCAATTTAGCAGTCATCM^ 

TAATTTACAATCGATCGACCTCAiSTCATCACCAAATAGTCAAACCAATTATTAA 

>retrotransposon_25 1047bp public: 1..1047; zeta-like LTR:^ 314. .822 

TAATAATTGATTGGGTTTTTGGGAAATGAGCAATTGTCTACAAATCTATGCATAT^^ 

GGTTAACCTTGATCAAGAAGAAGGGAGTGGGGGGGGGGGTGCATTtATCCTTTATG 

GATGCATAATTCGTAATATAACGTAATTAATGAGGAATTAAATAAATAAATTGATCTGATACAAC 

AAAAAGAAGAAATTTAATTAATAGTGTGGCACGTGACAGTTGATTCTAGATGAATTC^ 

CCGftACCGAACAAAAACAGGGCAAAATGATTACTGTTGTAATATAGCTAATGCTAATTGTTGATTAGTGT 

GGAAAGCCTAATAAGGTTATATTGTGCAGAGGtTAACTACGTTAATATAGTTATT 

GCTGTTGACTAGTATTGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTAATTGATTAGTGAiUyVCCAAG^ 

AACTAGGGTATTAAATTATTGtATTAAGATTGATTCCTATTAAGGATAJ^CAG^^ 

AGAAAGGGTGGATTATAAATATGTGTAAAAATCCCCTTTAGAGACTAATCAGTAGAAATCTATTGATGGT 

TTCATATATAGAGAfTAACGATtATATTTATAATATAAGTTGGTAGTTGCT^^ 

CAGTATAGTATGTCAGAATCAGATCATTTAAACTCtACTAATAATAGAGGAAACACTTTCATt^^^ 

ATCAAGCCAGTACAATAATGGCAGATCAAACTCAAGGAGCTAACCCACAACACCACTCAGATTTAGCCCC 

TCTAAAATGCATATGGCACAATGATCTCACCTCGGTTGGTTAAACCTTTTTCTTCTTATTAAATC 

TAGtTGtAGGTTGGTCTCGCGCGCCTAAGTAGTTTTACAATTCAATTATTAAACGAAT.T^ 

GTATTTTGTAAACAAGACTCAtTAATAATGAATCGTCAATGCATATGATCAAA^ 

>retrotransposon 26 7929bp Incyte: 1..7929; zeta-like I*TR: 3346., 3S53 

AAGAGATTGTAGTGAAGAATTCAGCTCATTATTACTGTTTTGTCGTTGC 

AATGCGCCACAAeAGTGTTACTATGCATGTGGrtCTGACTGAGTGATATTGTTTAAAAATTA^^ 

TCAAATMCAAAAGTtTAAATTTTCAAGGTTTGTAAACATGGCAGCTAGTAGTAGGATGGTTCATAATAT 

TAATTAATTATTAGTAATAATGGCTAAGTTTTTGAAGCATTGTTTTAAATTTTCAAA 

TGATTACAAATGGATTACtAACGGAATTCCTAAGGTGAAGTGAATAGCGTGATTGAAAeATTTGMTTTG 

TATCTTTTAGATTAGCTATTTttACtTTTTTTGTCATTGTAGTTGGTTAtGATAATTA^ 

GTTTAATATTTTCATATTGATTTTCTTTTTTGGCCAACTTGCAAATAACAGACAAACCCAAAATTi^ 

ATTAGATTTMTGCATGCATAATTACACAGAATGTTTAGCCTTAACAAGTATTCTAGAAACAAGAA^ 

AT^TGTCGTCTTGGCGTTTATCTTAATTGTATTCTGTAAACTGGGTTAATTCTTATTt 

TTTTTTTGGATCTTGTATGGATTAAAAATTAAATATGGTAtGTT.TTAGGGTTGTATTAACAATAGTTACA 

AtTATGAATCATAGAGGTtTACTATTTTTATTTAfCAGCAAATAGGGGAATTCAAGTtGCATGTGTTA^ 

GAGTCSGCAGTCAATeATAAAACAGCCAACTTGCAGCTtATTTCACTCGAGGAGCAATCATCAGGGAATTC 

CGTTTCGCATCTCATTTtCATACTCTGTGGAtTATGTATAGAGGCTATTTACAATATCACCAAGCAGT^^ 

AACATTCTCTCCTCAAAATAACAATAAGATTAGTCAAGATGAACGAGTTGAATCTATTCATATGCATTA 

ACATTTAGTTTCTATTACAAATAGTGATGCAATGGTGCAAGATTACGTCTTGTCTGCAC.TAACTATTTGT 

AACGATGATTATGTGATCAAGAATTGGAATTCTTATTATATTCAGTC.GTGAGTGTAAGCTATTTCGTTAG 

GGTTATCTTAACTCGAAGTTAAAGTTCGAAAACTATTCCATtTGGAGTTTCTGTTGTTGAGAAATACAAA; 

ATACTCTTCTTGGTGGGGAGGAAAtCCATTAATGATTATAAAATGAAAC.TCTTGGTAACCTAATTGAAAC 



FIG. 71R 



TAATCTAATGGAAATTTTAAATCCATGAAAGGGGTGAAAATTTGAAATCAAAATAACTATCTGAACTGAA 
AmCCCCATGGATCTGATATCTTATACAATCTATCftACTAAACAG 



^^^TdTCAMTtTTTGTTATTGf^^^^ 



TGTAftAAAC " ^-^^^^'^^^'^^ fir.n^TTn a aTnaaTTrr A^rirAGGCAGTATTATAAftACCTCGi^J^TAACTA 



ATCAAAC 

tcactgatSgtgTctt'gTccgt 



GTCTTGGGTGC 

GGAATC " ^ ^'^^^ ^^'^TrTn a B a AT nr:n AGTTf!TAftACATGGTACGTTCTGCTAAGTAATATCATeGATCTAT 



CTATTTTGCTC 

ggatagtgatt^ 
cggttag; 

agtactggatgc 

CCAAATGCGGTACTCCGATAGtCTTATAAATAATACTTGGCAAAAGTTCAATAAATATATGTC^ 
TTGeTTTCCAATTACCATTGACGAGG.TTGTAAATTAATTCATACTTAGGTGACATC^^ 

ATATGTCTGTTl 

ggccaaccccttc 
gtattttat; 

TGCAAAGCCATC 

ACArTTTAACTTT^AG^AAATGATACCACCAAGAAGAAAGCA^ 

X X i J. . _^ _ »»^-nr^m<n « mm T^ Tv 7\ TV m n r"pr•r•'r/-'pr'r?r•'T'r' 

ATTGC 
TT? 

CTCCTTTC 
AACTAl 
ACCXGCCGC 
GAATTGAATl 
. TTTGACCAC 
GCCTTACTCa 
AATGCTAAT 
AGTTATTGT!] 
AATTGAATAG 
AAACAGAGAG 

CACTAG/ 

CTAGTATMTTGAAAGCACTACAGTATAGTATGTCAGAATCAGATC^^^ 

GAAAGACTTTeATTAGTGTAGATCAAGCCAGTAeAATAATGGCAGATa^AACTGAAGGAGCTAAGCGACA 
ACAftCAGeCTAGTCTTCTTGACACTAAAAAAAflAAGAGATAAAAAACAATTTGAGCCAATCAeATGTACT 
ACATTTGTAATAGATTTTATTACTTCAGCTGCTTATTACACAAACAAGGTTGAATTGATAT.TGTGTAGAG 
TAAATTTTeGGAAAtAGTTTGAATTGGGTGATGATTTTCTTTATTTTTTTTTATGTCTTGTTTGTGTGAA 
GATCGGAATGCCAGGGTGGAGCTCGTGAATTGCACGACTAATTGCAGCAGeACCATATTTCAAATAAAGT 
TTCTCATGTTGTAATAGGATTGCTTGTCTCCATGAAACCAATGAGTTAAeTAAGCCCCAGGCTGATTAGT 
GTGTTTTCAAAGAGTTTTGTACTASAGARACTCaVGACCTTCTCAGGGC^^^^^ 
CACf 



JJ^J^^iTCCGcTTACGTAATGAt 



tgtt6tctctgatccwCg¥gaaatggaa^ 



TACAACTT1 _ 

TGTAGATGCTCTAAAAMAAkTAGACATTTCCAGGCTTttGTTTACTGCTTA^^ 



GTAACAATv*r*a.*ixj-.w-.-^— 

CCGAAATTTTGCCATtTtGATT.TTTGATTTTTTCGtAtTCCTTGT,TGTTTCGATASTTT.TTTAGTTACTC 

CTCCTCAAeTAAAGTAGATAACTCGTGACAGTTAACAACAGAAAGGTATGTtAAATATTTATTTCGTTCT 

AAATTGAAGTTTGGTATAGAATATTGCAAACAACAACAATTTGAAAAATGGACTTTAATTTGTTCTACAA 

AATGCAAAGACATCTAGAATTAATATTTGCTCTGGAAACCGTATAC^^^ 

eCTGATATCTA 
GAATCATT.TTAAI 

TTC ACCACTCAAC 

TATeGGGATTTTCAATAATGTTTATTTGGAAATTTAGTATATACCGA^ 
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CGATGGATTTACCAAAAAAATGGGGAATGAGTGTACACCAAGAAAAAAAAGAAAAATTCAAGAAAAAGCG 

AGTC 
ACTI 



TTCTA' 



TTGT.'I 

eeCATATCAATAGAATAGCGGTAA^ 



G' 
ATI 



TTGCAGATTGGdGi^^^ 

ACAO «*--**-***m^ 



GTAGCCGTGGAAGCAAGACAtGTATCGAAACTCAAATCTATACCCTCAAGAAACACTAGTGA^ 
CATTATTGGCCGGTACTGGGGCAGCTGCAAACtATGGAAGAAACAGAGCCAATACTCCAGTGGACGGTGT 

CG 



gttatgctgcattggggaacttggtacaatcatatgataaaaMtcacataacgactcatccatgcttag 

GAG 



tgt 



TGTTVfTGCTTGTTTGTATACCAAAACACTCtt 

ATTGTCCATTTGTCtATTAGTCTGTAACTGGAAATTTGTCCGGTCGTTAAATTATTTTTTTTTTG 

TCTTTtGATTTGAATCATT .^^^ ^. ^ , 

>retrotransposon_27 2292bp In^^ 1. .2292; zeta-like LTR: 1327.. 1834 



GCCTGGCCAGTTCTATTTTTATAAATATTGGCTGTGTGTTTTGGGTGtGGTTGGGCCGGGCAGAGGlGTGG^^ 

GAGAGAGGdATGAATGCGGAAGAGGAAGGAGGTCATTCCATTCGATTCCATCGCCTCATTGTT 

GTTGATTCATTTAATTACGACAGCAGCAGAAGAAAAAAAAAAAGAATTCAGATGTAGATCACGTGCCAAT 



AAAAAAtCTGAATAATTTGTTAGTTCTCTATGAATGAATAAAGAGATTACTGATAAGAACCAGA 

AGTTAG 
Ki 
TC 



TGTCACCTTTTTATACCGAATTTTTTTTTATG 

ATTTCCCATGTGGATTGAATTTTCAAAATTGGTTACATAtATCGTTGAAAGTGTTCATAATTTTTGTGTT 
GTAATATAGGTAATGCTAATTCTTGATTAGTGTGGAAAGGCTAATAAGGT.TATATTGTGCAGAGGTTAAC 



3 
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TACCTTAATATAGTTATTGTTAATACAGTTATTGGTGTTGACTACTATTGTTATTGTTAAATTAAAGTGT 
TAGGTTGAGTTAATTGATTAGTGAAAACCAACTAACTACCGTATTAAATTATTGTATTAAGATTGATTCC 
TATTAAGGATAAAACAGAGAGTGTGTTAGAAAGAGAAAGGGTGGATTATAAATATGTGTAAAATGCCC 
TAGAGACTAATCACTAGAAATCTATTGATGGTTTCATAtATAGAGTTTAAGGATTATATTTAt^ 
GTTGGTAGTTGCTAGTATATtTGAAAGCACTAeAGTATAGTATGTCAGAATCAGATCATTTAAACTeTAC 
TAATAATACAGGAAACACTTTGATTAGTCTAGATCAAGCCAGTACAATAATGGCAGATC^ 
GTTAACCCACAACATTTtGTAGTCGTAAACTTGAAATTCAAAGAGAAGGGGGGGAATTAAATTGGGTGCA 
ACGTGTTTGTCAAAAATTTGGTGTGAAAAAAATTAATTTAACACTCTGCATTGTACCATAGGG^^^ 
TACCCAGAAATAAGAGAMTTATCACGTGAGACTAAAACTAAATATAATAAATTAA^ 
AAdA<:ACTGAAACTAACTTCTTGGTGTATTAATTT:TCAACACTTGATCACAAGTGCGGGGATT^^ 
ATTGCAAAGAGTGTGTTAGAAAGAGCGAAGGTGGATTATGAATATTGGAGAATCCTCTTTAGAGAeTATG 
CGCTAACAAAATAGATGAACTTGCTCAACAGAAAGAACTAATQGACTAACTGACTAAAATT^^ 




AGGCTAATAAGGTTATAT.TGTGCACAGGTTAACTACCTTAATATAGTTATTGTTAATACAGTTATTGCTG 
TTGACTACTATTGTTATTGTTAAATTAAAGtGTTAGGTTGAGTTAATTGAATAGTGAAAACCAA^ 
ACGGTATTAAATTATTGTATTAAGATTGATTCCTATTAAGGATAAAACAGAGAGTGTGT.TAGAAAGAGAA 
AGGGTGGATTATAAATATGTGTAAAATCCCCTTTAGAGACTAACCACTAGAM 

ATATAGAGATTAACGATTATATTTATAATATAAGTTGGTAGTTGCTAGTATATTTGAAAGCACTACAGTA: 
TAGTATGTCAGAATCAGATCAATTAAACTCTAGTAATAATACAGGAAACACTtTCATTAGTeTAGATCAA.. 
GCCAGTACAATAATGGCAGATCAAAGTCAAGGAGGTAACCCACAAGAGGTTATGAGCCTGGCCCGCTTAT 
TGAATTTAGATAATATAGGGGCAATGAAAGQTTTTGAAAGTGTTGATTTtCCTGAATCATTAAAAGTAGA 




ATCCAAGATTAATTTTCAAGTGTGGAGAAATGAAATCCTTAGATATGCACGTGGTATTGGTGCTGAGTTT 

GAAAAC 
TATTGATTC 



ACATTAATGCTCAAACTGCAACAGAGAGAGAAGTTCTTM^ 

TATATTACCA(:yy\GAGTACCTtAGAAGTGCCCATCCAGTTCTTGATAAAAATGT,G^^ 
GATACCCATCCAAAATGTGATATTGATCAAATTATGTGATTTGTAAATAATGAACTGATTAA 
GGAAAAATGATACAAGGGAAAATGATATGGGAeAGAATTTAAGAGAGAGtGAT.TTAAGAGAGA 

AAGTG 
GGAAC 
CA 



GC 

TATT 
TA' 
ACTTA< 
GTGTTA' 
TTTAG' 



TT. 
TA* 

TAATGTT. 
TAA' 
ATTT 
T 



TAGTGGATATTGAGTGTTTATTTGTTTCATGGCAGAGGATATT 

'TGGTATAAGGAAGACCATAAAAGTTGGTtCGAAATAGTCAACCAACCAATAAAGATTCGCTCA 

>retrotransppsbh_^30 28 58bp Incyte: 1,.2858; zeta-like LTR: 814-, 1321, 
reverse transcriptase fragment (contains stop codon) : 635iw>537 



CGTC 
GAGCT 
TAGTT 

tec 

ACGGGATA 
AAAG 
ATATA 
ATTAGCT 
TTTCACtT 
ATATGGGG 




•GGAAGAATAACTCTGTGATAGTGCATACATTCAAACAAAATGAATCTAGTTTCCAACATCTT 
•GGTAATGTAATTATTCTTGTTCTGGCACCGACAATGGGTATTGTTTTGTAGGTGGAGGACTA^ 
iTACCACCTCAATTTTTGGATCGCAGCTCdCACGCAGGGGTGGeTTCTGATCTAACTCACTtT 




GA" 
tGATTA< 
TACAGT 
AAAA' 



AAAGCACTACAGTATAGTATGTCAGAAtCAGATCATTTAAATTCTACtA^^ 

TTAGTCtAG 
CAGTAT 
TG 

GTTATG^ 
TAATACC; 

GTACCC* _ 
TRTCAAAAGAGTTTATAtTATGGTTACTCGACGGTATTATT 

CAGTGGACAAAATTCAAGAGTAGTGtTTGTTTAGACTTTACAGGACATGATAGTATATATAACAAAAATG 
AAATAC 



ATGACACA1 - 

CCACTCTTGTGACTTCGATATAGATACTCTCGATGAAATGTCTCAAATTAGAGGACAAAC^^ 



p ^• 
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AATCTTGGCTAATCACCCATGTAACATGGAGGAACCAAACACATAGATATACGGTACCATTTCATACAGA 



TA( 



TCTCTdTAACGATGACATGTCCAATtCTAATGAAAATAATTATTM 



>retrOtransposon_31 1636bp Incyte:: 1. .1636; zeta-like LTR: <595. , 1098 



A' 
A^ 
AT. 



GA 



gjVG- 

TTCATATATAGAGATTAAGGATTATATTTATAATATAAGTTGG 



AGTT 

GAACTTTATCTTGATGTTATTAA^ 



AAAtCTATATTACCACAAGAGTACCT ^ 
>retrotransposon_32 2125bp Incyte : 1 . .2125 ; z6ta-like LTR: 1105.. 1612 



ATCTTi 



CTATATGTAGTAGGGGAAAGTCGGAGTCGGAATTTGAAAAAAAAAGAGAAAAAAGAACGAATATTTAGAC 
tGTAAAATTCAAACCCCTGCTGATTAGTATATAAAAAA^ 
TTCGC ~ " 

GTGAT 

ACCTC - 

ATGCTAATTCTTGATTAGTGTGGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAACTA^ 

GTTATTGTTAATACAGTTATTGCTGTTGACTACTATTGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTA 

ATTGATTAGTGAAAACCAACTAAGTACGGTATTAAATTATTGTATTAAGATTGATTCCTATTAAGGATi^ 

AACAGAGAGTGTGTTAGAAAGAGAAAGGGTGGATTATAAATATGTGTAAAATCCCCTTTAGAGAC^ 

ACTAGAAATCTATTGATGGTTTCATATATAGAGATTAJUlGAtTATATTCATAATATAAGTTGGTAGTTGC 
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TAGTATATTTGAAAGCACTAGAGTATAGTATGTCAGAATCAGATCAATTAAACTCTACTAATAATACAGG 

AaArACTTTCATTAGTCTAGATCAAGCCAGTAeAATAATAGCAGATCAAACTGAAGGAGGTAACCCA^ 

rATAGAATACGTTTTCAACTAGTTAAGTATCCACTAACCTAAATTTTTTTTTTAAT 

TTAGTCTTTC 
TTCAG 
AAATTG 
CACAC 
CTGCtTAAC 
CCCCTGC 

CJCAC™^ Iricyte: 1..1292; sah-like LTR:: 369. . 749, CTA2 
(transcription factor) : j oin( 974 . ,>234 , <888 . . 1292 ). 

gtaatccaaWtccataacccaactgctcaacggcgaaatccaaaacttccatgctattctaga 

CAGTGTCGAAACTCAATGATGCAGAGTGGTGTCTGGGCGTTAtGGTTGAAAAGAAAAAGAAACTTGACGA 
ATTGAAAGTGAAAGAAGAAGCGGCAAGAAAGAAGGAAGAAGGGGCAAAGAAAAAGGAAGAAGAGGC 



GTGCAAA^ATTCTATTTTAGTTGATTTTTATATACTTTTATTTTAC^T^^ 

TATCTTTTCTTT 
ATATTTTC 

TTTCTAG/ — - 

TTGAAAGATAAAT^lTAGTCATAfTTATTTTGTATTTAGT^ 

TAGTATTGTCATACCACGTAGATTGATACGGACATACTTAGCAGATTTAACATATATTAAGCACCG^^^ 

CCTGTGACATTGCGGAGTTTACTGTTTGGCGCACGGTGGCAGACGAACATCAACTGATCTTTTATAC^^^ 

ATATTCTTACGATTATAACTTTCAATTAAGAAATACAACTTCTTATTAGCATTCTCCTACAAGT 

GTTCGTAGGAATTTCTT.CGAAACTATAATTAAAGACGAAAAGTGTAAAACAAACAGAA^ 

CGAGAAGAAGGCAGAGGAGGCCGTCCCACAAAAGTTTGAGAACTTTGACGAC'rTTATTGGCTTTGACATC 

AACGAGATGCAGAACGACGATAGGATCGACGATACCATCGACGATACCATGGACGAAACCATCGATGAAA 

CCATCGACGATAGCAACGACGAAGACATGTTGTGCAAGATGGACTACGAAAATCTAGATCCGGACGAGAC 

CATCGACGAAGTACCTGCCACGACAGACAGCGACTTGGACATGAACAACATACTTGAA^ 

ATATTAGAGGGGTTGAACATGACATTCCTCGACAATGGGAACAACAGCAACCACGTAAAGGAAGAGra 

ATGTAGACGGCTtTTTAAACCAGTTTGGTAAT ^ ^ ^ 

>retrotranspos6n 34 568bp Incyte: 1. .568; san-like LTR: 113.. 493 
GATTGtATAGTGGTGTGGTTGATCGACTTGAATATAACAAGAGAGAGATGAGATGAGATGCTTTTATCGC 
GTATATATTTTTTTTTCCATTGACAATTCTGATTTCACAAATTGTTCGCTATAGGGTAGGTCT^^ 
TAATTTTACCGGACACAAGATGAAATATTTTGTGTTGAGCACTCGTTGTeGACAGTGAAAAATTTT^^ 




ATTATCTl 

TTAACATATATTAAGdACCGATTACCTGTGAGATTCCGGAG 
ACAGATTAGAAGCTTGGTAAATCTTTGGTTAT.TCATCACGTCTTGAGAATM^^ 

ATTTTCAA 

>retrotransposon_35 946bp public: 1..946; san-like LTR: 113..493> CTA2 
(transcription factor) C-terminus : <632..946 

GATTGTATAGTGGTGTGGTTGATGGACTTCAATATAACAAGAGAGAGATGAGATGAGAT 



CAAGAAAATATTTTATCATCACTTTTTGTAGAATGGAGGTTCAAGTGTtGGAGA^^ 

TGATATTC 
AfTATC 
TT? 
ACAT 
TAGCATTC 
AAACAAACAG 
GACGACtTTAl 
AGGACC 
AAAC 

TTT(3AtGTA(3ACAGGTTTTTAAACCAGTTTGGeAAT 



FIG. 71X 



>retrotransposon_3,6 951bp Incyte: 1...951; san-like LTR: 389,. 769; POL 
protein: <1 . . 321 

GATTTGAGAAATACCATTGMGATG.TAGAGTTAAAAATMGGAATTTGCATGTACATGAGGATM 
^r'r->rr'nT'TnraaTrTTAaAf;AATGATAATTTCCAGCCACATAGACCGATT 



AATU^TATTTTATCATCACTTtTTCTAGAATGGAGGTTCAAGTGTTGGAGAATAGAGA 



TtTATCTACGAGGCTCTGATATTTAGAGCGACAACTAC^ 
.ACGAATTGlAGGGTATTCTGAACGGGAAAGTACAAGTAGCA 
>retrotransposph_36 POL protein l67.ka 



FTKALGRNKLIEHTKRIRERkDYDNNATSIVDVRTLE 

>retrotransposon_37 9850bp public: 1. ,9850; san-iike LTR:: 369,. 769; CTA2 N- 
terminus: l. .>234, GAG protein: 939. .1853> POL protein fragment 1:: 
1896.. 2360/ POL protein fragment 2: 2509... 4893, POL protein fragment 3 
(reverse transcriptase.) : 4953. .5723 

GTAATCGAAAAATCGATAAGGGAACTGGTCAACGGCGAAATCCAAAACTTCCAtGCT^^ 



ATTGAAAGTCAAAGAAGAAGGGGCAAGAAAGAAGGAAGAAGGGGCAAAGAAAAAGGAAGAAGAGGGAAAG 



TrrCTAGAAGGGAGGTTCAAGTGtTGGAGAATAGAGAGCGAAGACGTGATATTC 



CGAATTAATAGAAAGAAAAGTTAGTCCAAATGTTTGTAGAGAGATGAATGATGGACAGGCAGAATTTGTT 



AGATT 



.TTGGAAGTGGTGAAGGGGAGAGATGTAGGGCTTATGGTTTAGGTACTGTAACCATATCTGTGAATGGATT 
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TCTGGAGAATCCCTGAAAAATCCAATGGATTGATCAAGAAAAATTAGATCCGTTGAAAATGACCAATAAA 
GTAGAAAGAGTTACCTATGTGAGCATACGCAACATCAAACAAGAAGTGGCAGACAAATATATGATAAAAG 



A< 
TG. 



CCAATGATTCGCACAAACCAACATGAtAGACGTGGAGACAATATAAATGTCGAATATGAAAACCGTCCAA 

ATGTACCATTTGAATATCATGCTGAACCTGeTGGTACAAATTCATCGAeGGGAATTATCGATC^^ 

TATTAGACCTAGAGGTGATCCCACCTGGCAACGTATGCCTGATGCCAACATACATCAGGAAACAACAACT 

GTACAGACTCCTGATCATGGGGAGTTAGATACCATGATCAACAACGAACACCAACTACCACGATGTGGGG 

AGGGTAATTACGCGGGGGAACAGGTGCGCACCiSATATTATTGGGCAATTT 



AT. 



AT' 



GTGTATA- 
TTAGT' 
ACAAG< 
AA( 



CT 
AAGTC 
GGTGT* 
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CAAAAAAC^GTGAACCAGAGCAATAATJGCTA^^^^ 

ctcccaaactgat 
cgccttatacgc; 
cttttttttgtacctgi 
aagagaaaacaatagag^ 
tttagtttagttccatj 

ggtScaccAagga^ 

TTS^CttCeCTTTTGTCTATCra^^ 



iGA?ATGAGAMTi?^^^^^ 
ATGAACCCTATATTC'^ •^'^ '^^ 



GAGATTATCAG 
ACTATTAGTl 
6ACCTGAAATTCC 
AATGGTTGTAGTl 

?tatSattctttc^^^ 

GtGGACTATTTGAGCTTTAAAGTACTAACTTGTTTTCAGACTATCAATCTATGTGTTTGT 

gcaScgagtc^^^^ 

ef,TTTTTAATTC 

AaATTiT'GATACG 

CCAATCTCATTGVTCeTTGCATGAGMTGAT^ 
iSAATAGGRCATGGTACTACCTTGCCAATTAAAGTAtGATGT^^ 

gcaaagtg? 

TAATATTTTCATC 
TATTGGGGTAATI 
TTCAGGATATTCCTAt 
AAGAAAACi 

■fTiiTtrn/^TV 3i liTt 

CTGTACGCTTTTCTAGGCTGbAAATTATGTAAGtTCTTG 

TCATAAGXTTATATCCAAGARAAAAATGGTTTATAAGCGTATAATGMAATAATAATATTATT^^ 
MGGCCAAAAGAAATCTAAAGTTGGGAATAATtCGCTAGTTGGGGGGAAGTTGGCAATAATAAATGAGCA 
GGCGTTTTGATATTTATAATAATAGGTCAGCTGTTTTGAGtATTTCCTACAGGGACTTTWTTTCATAA 
GGTGGATATGCTATCAGTTGGTGAAACAAeTtCAAATTGGTGTAeTTTGCTTATGCCAGATACT 

tG^GAAATTGTT? " '^'^'''''^ ''■'"''"'^'^'^"^'^''^^'^"'^^'^'^^^^ 



AAGAAAAGGCTTTACATAAATAAGGTTTATATAATTATACGTTGAAAAATGACCCT 



SeAAAAGATCTGATT?AT"TATGAC^^ 
AGATAATAtAGAACAGTTATGCCACGTGGGTGGATTTAATAGAATCCTTGTAAAATATTATCTCT^^^ 

ATTATAAGGGGAGGAGAGAAGATCTATGGCAATGCAAGAAAATGCAAGATCATCGT^^ 

AATGACTCGATAAGATATATAAAGGCAGTTGTTTGAAGAGCGCtTACTACACGGGGTTGTCTTAATACAA 

aggcggcag 
cctgtagt; 

TCACC 

AAAAGT AT AT T AG/_ 

tTAACCATCGAAATTTAACCCGTTTTATAATACAATTTTGACCACATGTA 

>retrotransDOSon 37 GAG 305a.a 

MAEFSDAELRKMMGTLSLLVQDSRREINHLHDKLENNSDSKYQSLETYIN^^ 

SELVNtWIMCraOVKRFHPQVFDAFMEAENEDEIGIEKIQYTPYTGKHLNb^^ 

NVSREMNDGQPQFVPNLFKK^^rEMIISKPDVSAAERIGkALFKLQSKSRELERESAFL^^ 

ddiiSlvsgv^ 

kwnaakntvqvnnvssknnkkkde 

>ret:rotransposon 37 POL fragment. 1 155aa 

SEINATSTYHEIGDTNKNKEQLILNLKNHTiCLSEQKKKTNLLVYDSG 

i:,t..j.WHii»i.inn,xouiLNrM - TLisiENLMCLVHSDHGPTV 



lAKYSPKDDLYSGPR 
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>retrotransposon 37 POL fragment 2 795aa 

MTNKVERVTYVSIRNIKQEVADkYMIKDLYYYHLLINHLSHEKLQLLVKRGVIKPVKSTSAE 



RLRVWNNRFi 
O 



PLNHPMIRTNQHDRRGDNINVEYENRPNVPFEYHAEPPRTNSSTGIIDRPPIRPRADPT^^ 

ETTi 
SENPII 



PQVEDIRLTTPKKDKSLSPDFNQTHNEIQLFMADINEDMLEEYDENIN 
GRIEYIADRVRKKTEVSMVRHTGNI 

>retrotransposon 37 POL fragment 2 (reverse transcriptase ) 257aa 

MDDEVGIAISKIRNFPFRLKDGRASFFPP.YKTKFGRSVHPPKRYLNAIVKKIDYNQKEWRQSMEEEI 

KANQVYTVEKTPKmn/PLKTMWVHTYKTNDLKNHNYKSRC^ 

LSAIAWNNLVMHQLDIASAYLNASLEDGRVIFVRPPRGFEVKPGYSMLHKSVYGLRQSAHNWYSHF^ 
VLEAN.GLKQtLHNDGIFWKNYENGDVLYySVYVDDVFIKANSMSLCN 

>retrotranspos6n_38 :3159bp public: 1. .2084, Incyte: 2085,. . 3159; san-Xike 
LTR: 2638.. 3G19 



ACCCCTGGCTGTTGTTGGAAAAGACTCGTGACAAGTATTTTTGGCCACGAGTCT 



GTGTGCA( 



TTGT' 



TGGGACACACACTGGAGCTGGAATCCATGGTCAGGAAATGTGAAAATTTTGTTCTCGGGAAATATTT^ 
ACAAl 

TCGTCAATATC 
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CAAGCTAATTTTACCCGACACAAGATGAAATATTTTCTGTTGAGCACTCGTTGTCGACAGTGAAAAATTT 

Tf^rTrRAGAAAATATTTTCATCJVTGACTTTTTGTAGAAAGGAGGTTGAAGTGTTGGA^^ 

ikrACCTGATATTCCCAAGGTeGAATTAGATTGAAAGATAAATAATAGTCA 

rAaTAAAtTATCTTTTTATAtTTAAATTCTTAGTATTGTCATACCACGTAGATTGA^^^ 

rrAfeATTTAACATATATTAAGCACCGATTACCTGTGACATTCCGAAGTTTA^ 

AGACGSeACTTATCAAGGTGCTACTCeCGCGCATCAGTTTeCTCTGGGTTCTCTTTTTGATC 

ACTSSTTTTTtCCCAGTCGCGTGAGAAGTTCAACACTTTTTTTTACGCAT^^ 

TTGCCCACC 
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Name 



Length Regions of interest 
(bp) 



Remarks 



Novelty 



AF041469 (280 bp) Candida a/b/cans retrotransposon long temiinal repeat kappa, complete sequence 

retmtrahsposon^OI 994 LTR kappa: 548..927 partiai sequence 

present in public 
domain 

rBtrdtranspdsbh_d2 li348 LtR kappa: 764.1043* POL part/a/ sequence 

(contains stop cbdons): present in public 

<136..7i4 domain 
mtrotransposoh 03 3034 LTFi kappa: 75 .354 cpmp/efe sequerice 

■* present in pulrfic 

domain, identity 99% 



AF043301 (5624 bp) Candida albicans retrotransposon-like element Jcal, a)nip!ete sequence 
rBtrptran$posbn_04 3504 Tcal-like LTR:688;.1075 



retrotranspdsonjDS 
retrotransposonjOS 
fetiPOtmnsposon^O? 



3955 Tea ViBce LTR: 2656 .3043 



1434 tca1-like LTR: 87. 475 



1606 TcaHflce LTR: 1046.1433 



comp/efe sequence 
present in public 
doniain, identity 99% 
co/np/efe sequence 
present in public 
doinaih, identity 99% 
complete seqtiehce 
present in public 
domain, identity 100% 
cbmp/ete sequence 
present in public 
domain, identity 9B% 



AF050215 (6980 tip) Cancf/da a/6/ca/7s Tca2 retrotransposon gag polyprotein (gag) and pol polyprotein (pol) genes 
complete cds 

Tca2-like LTR: 49..328 



fetrotransposdh_08 
reiroiran&poson_09 
retrotransposon_10 
reifbtransposon^ i1 
retrx>transpdsdh_i2. 
retroiransposdn_13 



1385 



1483: Tca2-Iike LTR: 871..i l6d 



879 Tca2-like LTR: 3261.665 



974 Tca2-like LTR: 483 .761 , 
CTA2 (trahscriptidn factor): 
join(<974.;>778.<223..>1) 

3868 Tca2-like LTR: 127..407 



469 tca2-fikiB LTR 75;:355 



pa/t/a/ sequence 
present in public 
domain 

complete sequence 
present in public 
domain; Identity 99% 
complete sequence 
present in public 
domain, identity 100% 
pa/tra/ sequence 
present in public 
donrtaiii 

complete sequence 
present in public 
domain, identity 99% 
complete sequence 
present In publk: 
domain, identity 99% 




rBtrotransposori^l 5 
retrolransposon^ i 6 
retrdirahsp6son_ 1 7 
retifotransposdh:^ IB 
retmtranspdsdh_19 



2093 



2099 



3284 



791 



4581: 



YcaS-fike LT R: T569..1822 



Tca3-Iike LTR: 1565.1 878 
Tca3-like LTR: 2750..3063 
Tca3-likeLTR:,277..590 
Tca3-like LTR: 2725.:3q37 



pd/tiraf sequence 
present in public 
domain 

comp/ete sequeirice 
present in public 
domain, identity 100% 
partial sequence 
present in public 
domain 

partra/ sequence 
present in public 
domain 

part/a/ sequence 
present in public 
domairi 



AF065434 (1145 bp) Candida, albicans relrotrahsposon Tea 5 reverse transcriptase (pol) gene, partial cds 



FIG. 72B 



rBtrotransposon^20 5325 



POL protein: rearranged 
CDS 



AF0694S0 (508) Candida albicans retrotranspcson long terminal repeat zeta, complete sequence 



paitiai sequence 
present in public 
domain 



rBtrotrBntposon_21 2027 

mtrotransposoh_22 21 18 

retroitansposonJZIi 4929 

mir6trm)spoBonj24 4954 

retrotransposoh^ZS 1047 

fiBtrotransposon_26 7929 

refrt)franspbsoy7_27 2292 

re(rofra"spbsb/t.28 2025 

rebt)franspbs6n_29' 2731 



LTR2eta:1384..l89l 
UTR zeta: 1419.1927 
LtR2eta:2990..3497 
LtR2eta:256..763 
LTRzeta:314.:822; 
LTR zeta: 3346.3853 
LtRzeta: li327..1834 
LTR zeta: <794-.1 294 
LTR zeta: 380..887 




"reiroiransposonj^l 
fBirotransposonj32 



AF074943 (381 bp) Cmtdida albicans retrotranspospn ibng temiinal repeat san, complete sequence 
«»#r«i«nen«*nn -ii 1292 LTR ssn: 369 .749. CTA2 



parf/a/ sequence 
present in public 
domain 

pa^a/ sequence 
present in public 
domain 

compiete sequence 
present ir> public 
domain, identity 100% 
comp/ete sequence 
present in public 
domain, identity 100% 
complete sequence 
present in public 
domain, identity 100% 
parffa/ sequence 
present in jsublic 
domain 

pa/tra/ sequence 
present in public 
domain 

pa/tia/ sequence 
present in public 
domain 

c»mp/efd seiquerid^^ 

present in public 

. domain, i dentity,1Q0 !j^ 



partfaf sequence 
present In public 
domain 

part/a/ sequence 
present in public 
domain . 



feirotransposon_33 1292 
retrtitransp<)sx)n_34 568 
mtrotrahspbsbhJiS 946 



LTR san: 369 .749, CTA2 
(transcrrption factor): 
jolnC974..>234.<888..12!S2) 
LTR san: 113 .493 



LtRsan: 113..493,CTA2 
(transcription factor) O 
terminus: <632.-946 




mtm&ansposonJ38 31^9 



:1 8S6eiZ360; POUiiroiefinfi . 
fragimenl ^ 2509:4893;:: ? 
:PQ^^tein firagnraent^i^- 
(reverse transcriptase^- 
49^5723:: '-' •• ■"'■^^ 
LTR san: 2638. 3019 



partial sequence 
present in public 
domain 

part/a/ sequence 
present in public 
domain 

comptefe sequisnice 
present in public 
domain. Wenti^ 

POL. / ::i^::y?^;^:;^)^eSw^^ 

contains:a^80v^v>•;•cbf^^i6^ 
GAOP^:.: - *::-.?presenti^ 



compfe^ sequence 
present in public 

. .domain, identity 99% 

AF078809 (1470 bp) Candida ato/cans Tca4 reUptransposon reverse transcriptase (pol) gene, partial cds; 



FIG77OT 



pURA UR I Inverted IntronlA3 / pRet 

L DNA 

Initial DNA construct. 



UR j Inverted Intronl A3 — ► 

Transcript from URA3 promoter (pURA). 



FIG. 73B 



pURA UR I Inverted IntronI A3 / 

(before splicing) 

pUR A UR A3 L 

(after splicing) 



FIG. 73C 



pUR A UR A3 / 

DNA 



Integrated spliced construct. 



FIG. 74A 



pURA UR ( IntronlA3 

DNA 

URA3 gene with forward Intron 

UR ( IntronlA3 ^ 
Initial Transcript 

URA3 
Spliced transcript 



FIG. 74B 



pURA UR I Inverted Intron}A3 

DNA 

URA3 gene with Inverted Intron 

UR j Inverted Intron|A3 ^ 

Initial Transcript (cannot be spliced) 



FIG. 75 



Left LTR 




LTR 



FIG. 76A 




FIG. 76B 



URAA3 URA3A(Deletioii) Homozygote 

URAA3 DNA with characteristic ASouthem pattern 



URA3+ 



URA3 allele due to gene conversion 




UR A3 LTR 




Integrated into genome following retrotransposition 



URA3 LTR 




